सोमवार, 16 जून 2008

हिंदी सीखने-सिखाने के लिए प्राकृतिक भाषा संसाधन (NLP) के अनुप्रयोगों की भूमिका

(29-30 जुलाई,2006 को टोक्यो विश्वविद्यालय में आयोजित अंतर्राष्ट्रीय हिंदी सम्मेलन में प्रस्तुत आलेख)
---विजय कुमार मल्होत्रा पूर्व निदेशक (हिंदी),रेल मंत्रालय, भारत सरकार

सार-संक्षेप

सूचना प्रौद्योगिकी (IT) के अंतर्गत अनेक ऐसी युक्तियाँ अंतर्निहित हैं,जिनके तार्किक सूत्रों की सहायता से प्राकृतिक भाषाओं के शिक्षण का मार्ग भी प्रशस्त किया जा सकता है.इस आलेख में MS ऑफ़िस हिंदी में प्रयुक्त कुछ ऐसी विधियों और प्राकृतिक भाषा संसाधन (NLP) संबंधी अनुप्रयोगों के उपयोग पर प्रकाश डाला गया है,जिनकी सहायता से अनायास ही देवनागरी लिपि की ध्वन्यात्मक और वर्णपरक व्यवस्था को रोमन लिपि के माध्यम से सीखा जा सकता है.भारत में हिंदीभाषी क्षेत्रों के सुदूरवर्ती इलाकों में स्थित पाठशालाओं में आज भी देवनागरी लिपि के अक्षर सिखाने के लिए बारहखड़ी का व्यापक उपयोग किया जाता है. MS ऑफ़िस हिंदी के अंतर्गत इसी बारहखड़ी का उपयोग देवनागरी लिपि के अक्षरों और उनकी मात्राओं के संयोजन के लिए किया गया है.इसके अंतर्गत रोमन लिपि की सहायता से हिंदी न जानने वाले छात्र न केवल देवनागरी लिपि के अक्षर संयोजन को सीख सकते हैं,बल्कि हिंदी पाठ को सहजता और सरलता से टाइप भी कर सकते हैं.इस कुंजीपटल को ध्वन्यात्मक लिप्यंतरण कुंजीपटल (Phonetic Transliteration Keyboard) कहा जाता है.
इसके अलावा, प्राकृतिक भाषा संसाधन (NLP) के अंतर्गत आज पेन्सिल्वानिया विश्वविद्यालय के प्रो.अरविंद जोशी के निर्देशन में विकसित वृक्ष संलग्न प्रणाली (TAG) नामक कलनविधि (Algorithm) की सहायता से विभिन्न भाषाओं में मशीनी अनुवाद प्रणाली जैसे अनुप्रयोगों का विकास किया जा रहा है. प्रस्तुत आलेख के लेखक को प्रो.अरविंद जोशी के निर्देशन में इसी टैग प्रणाली की सहायता से प्रो.सूरजभान सिंह द्वारा प्रस्तावित हिंदी वाक्य संरचना के सार्वभौमिक और भाषा-विशिष्ट लक्षणों को विश्लेषित करने के लिए अपेक्षित हिंदी पार्सर विकसित करने का अवसर मिला था और इसी कार्य के दौरान यह पाया गया कि टैग प्रणाली का उपयोग अन्य अनुप्रयोगों के अलावा शब्दवृत्त विकसित करने और हिंदी शिक्षण के लिए भी किया जा सकता है.इस आलेख में ऐसे अनेक उदाहरण देकर यह सिद्ध करने का प्रयास किया गया है कि युनिकोड के वैश्विक मानक पर आधारित अधुनातन कंप्यूटर प्रणाली हिंदी शिक्षण के लिए भी अत्यंत उपयोगी सिद्ध हो सकती है. ...........................



Role of NLP applications for learning / teaching Hindi
(A Paper for International Hindi Conference at Tokyo University on July 29-30,2006)
By
Vijay K Malhotra
Former Director (Hindi), Ministry of Railways, Govt of India


ABSTRACT

IT has a lot of potential to develop various techniques for learning natural languages through its inherent logical features. This paper deals with some of the features of MS Office Hindi and other NLP applications for the purpose of learning Hindi. Although Devanagari script used for Hindi is syllabic but its alphabetical order is phonetic in nature. Hence BARAHKHADI has been used for learning / teaching Hindi even in the remotest schools of Hindi heartland in India. Microsoft picked up this BARAHKHADI concept to enable the user just knowing Roman script to type Devanagari alphabets along with its maatraas without knowing Devanagari script and its keyboard by way of using Roman script. Hence this keyboard is called Phonetic Transliteration keyboard.
Besides, the NLP algorithm such as Tree Adjoing Grammar (TAG) developed by Prof Aravind Joshi of University of Pennsylvania is now being used extensively to develop various NLP applications such as MT System in various languages of the world including Hindi. This author had got an opportunity to assist NLP group of the University of Pennsylvania to develop a Hindi Parser to analyze the universal as well as language specific features of Hindi. This paper deals with some of the rules of Syntactic Grammar in Hindi proposed by Prof. SB Singh paving the way to develop a Lexicon in Hindi on the latest system of computer technology in Hindi based on UNICODE. Hence it can be concluded that MS Office Hindi and other NLP applications such as TAG algorithm can be used extensively for learning / teaching Hindi.

मुख्य आलेख / Main Paper
विश्वभर के भाषावैज्ञानिक और कंप्यूटर विशेषज्ञ आज यह स्वीकार करने लगे हैं कि शब्द एक बीज के समान है, जिसमें संपूर्ण वृक्ष के रूप में वाक्य को पुष्पित, पल्लवित और विकसित करने की क्षमता निहित है.वस्तुत :प्रत्येक शब्द विविध प्रकार के अभिलक्षणों का संविन्यास है.ये अभिलक्षण प्रकट और अप्रकट दोनों ही रूपों में शब्दों में निहित हैं.ये अभिलक्षण दो प्रकार के होते है : सार्वभौमिक और भाषाविशिष्ट.यदि इन अभिलक्षणों का समुचित विश्लेषण किया जाए तो न केवल शब्दों के विभिन्न अर्थों और संदर्भों को खोजा जा सकता है,बल्कि वाक्य रचना के सूक्ष्म नियमों को भी अनावृत किया जा सकता है.किंतु प्रचीन व्याकरण का आरंभिक स्वरूप मुख्यत : अनुशासनमूलक रहा है. अनुशासनमूलक व्याकरण का आग्रह भाषाविशेष की शुद्धता बनाए रखना था. टेरी विनोग्राद (1983) के शब्दों में, “ इस प्रकार भाषावैज्ञानिक का कार्य उस दौर में न्यायाधीश या पुलिसमैन का रहा होगा, जिसका दायित्व सामाजिक व्यवहार के रूप में भाषा के सही प्रयोग को अनुशासित रखना था.”
19 वीं सदी में डार्विन के विकासवाद के सिद्धांत से भाषाविज्ञान का क्षेत्र भी अछूता न रहा और तुलनात्मक भाषाविज्ञान के नाम से एक नया आयाम भाषाविज्ञान के क्षेत्र में जुड़ गया,जिसके अंतर्गत विभिन्न भाषाओं में अंतर्निहित समान और असमान वृत्तियों के आधार पर विश्व की सभी भाषाओं को विभिन्न भाषा-परिवारों में विभाजित कर दिया गया और उनकी प्रवृत्तियों के तुलनात्मक अध्ययन पर बल दिया जाने लगा. कालांतर में तुलनात्मक भाषाविज्ञान का स्थान संरचनात्मक और उसके बाद प्रजनक रूपांतरण व्याकरण ने ले लिया.चॉम्स्की (1965) के इसी प्रजनक रूपांतरण व्याकरण के (TG Grammar) आधार पर सर्वभाषा व्याकरण की परिकल्पना की गई.यद्यपि चॉम्स्की ने वाक्य को शब्द की संरचित माला के रूप में स्वीकार किया, लेकिन उनका प्रयास भाषाविशेष की प्रवृत्तियों का अध्ययन करने के बजाय भाषानिरपेक्ष और सार्वभौमिक तत्वों की खोज तक ही सीमित रहा. दासगुप्ता (1991),गीता (1985) और जैन (1960) ने यह दावा किया है कि सर्वभाषा व्याकरण का यह प्रयास विश्व की अनेक भाषाओं के संदर्भ में,विशेषकर भारतीय भाषाओं के संदर्भ में सफल नहीं हो पाया है. इस आलेख के वक्ता ने भी IIT, कानपुर (भारत) द्वारा आयोजित CPAL-2 के अवसर पर प्रस्तुत आलेख (1992, पृ.317) में हिंदी भाषा के संदर्भ में यही स्पष्ट किया था कि जब तक भाषाविशेष के विशिष्ट पक्षों का सम्यक् अध्ययन नहीं कर लिया जाता तब तक उस भाषा का संसाधन कंप्यूटर के माध्यम से नहीं हो पाएगा.जैसे हिंदी और अंग्रेज़ी के निम्नलिखित वाक्य देखें:
(1) राम को बुखार है.
(2) राम श्याम से मिलता है.
(3) Ram has a fever.
(4) Ram meets Shyam.
वाक्य (1) में ‘को’ का प्रयोग हिंदी की भाषाविशिष्ट प्रवृत्ति है.यह दिलचस्प तथ्य है कि वाक्य (3) के अंग्रेज़ी वाक्य में ‘को’ परसर्ग के समकक्ष कोई पूर्वसर्ग नहीं है, लेकिन सभी भारतीय भाषाओं में ‘को’ के समकक्ष परसर्ग का नियमित प्रयोग मिलता है:
(5) रामला ताप आहे. (मराठी)
(6) रामक्कु ज्वरम् (तमिल)
(7) रामन्नु पनियानु (मलयालम)
(8) रामनिगे ज्वर दिगे (कन्नड़)
(9) रामेर ताप आछे (बँगला)
यह प्रवृत्ति दक्षिण पूर्वेशिया की अन्य भाषाओं में भी मिलती है.इन्हीं समान भाषिक प्रवृत्तियों के कारण ही यह निष्कर्ष निकाला गया है कि सिर्फ भारत ही नहीं, बल्कि संपूर्ण दक्षिण पूर्वेशिया, एकभाषिक क्षेत्र (Linguistic Zone) है.
इसीप्रकार वाक्य (2) और (4) में श्याम के रूप में सहकर्ता की उपस्थिति ‘मिलना’ और ‘meet’ क्रिया की सार्वभौमिक प्रवृत्ति है, लेकिन वाक्य (2) में ‘से’ का प्रयोग हिंदी की भाषाविशिष्ट प्रवृत्ति है.यही कारण है कि वाक्य (4) में ‘से’ के समकक्ष किसी परप्रत्यय का प्रयोग नहीं है. इस प्रकार की भाषिक प्रवृत्तियों और अभिलक्षणों के विश्लेषण का कार्य प्राकृतिक भाषा संसाधन या Natural Language Processing (NLP) के अंतर्गत किया जाता है.NLP अभिकलनात्मक भाषाविज्ञान (Computational Linguistics) का ही एक अंग है. इसका उद्देश्य कंप्यूटर के ऐसे व्यापक मॉडल और डिज़ाइन तैयार करना है, जिनकी सहायता से मानव-मशीन के बीच संवाद स्थापित हो सके. आरंभ में कंप्यूटर के साथ संवाद के लिए बेसिक, कोबोल, पास्कल आदि प्रोग्रामिंग भाषाओं का प्रयोग किया जाता था, किंतु अब अंग्रेज़ी जैसी प्राकृतिक भाषाओं के माध्यम से भी कंप्यूटर से संवाद किया जा सकता है. NLP का मुख्य आधार स्तंभ है, शब्दवृत्त (Lexicon). NLP के अंतर्गत शब्दवृत्त के निर्माण की प्रक्रिया में मुख्यत : तीन उपागम (approaches) अपनाए जाते हैं : संरचनात्मक, लक्षणपरक और संबंधपरक. इन्हीं उपागमों के अंतर्गत अर्थपरक क्षेत्रों (Semantic Fields) के आधार पर शब्दों का वर्गीकरण किया जाता है.इस प्रकार सामान्य कोश में जहाँ शब्दों को अकारादि क्रम में रखा जाता है,वहीं संरचनात्मक उपागम के अंतर्गत शब्दों को अर्थपरक कोटियों में विभाजित किया जाता है,जैसे थिसॉरस आदि.लक्षणपरक उपागम के अंतर्गत पक्ष, वचन, काल, लिंग आदि व्याकरणिक सूचनाएँ दी जाती हैं.ये सूचनाएँ प्रकट रहती हैं.जैसे,’गया’ में “या” प्रत्यय भूतकाल, एकवचन और पुल्लिंग की सूचना देता है.हिंदी में संज्ञापद में बहुवचन के तिर्यक् रूप में परसर्ग की उपस्थिति अनिवार्य है और यह सूचना हमें शब्दवृत्त में की गई उसकी प्रविष्टि से अनायास ही मिल जाती है.उदाहरण के लिए हिंदी के किसी भी वाक्य में ‘लड़कों’ और ‘लड़कियों’ का प्रयोग परसर्ग (के, में से आदि) के बिना नहीं किया जा सकता है. लड़कों / लड़कियों को बुलाओ.
इतना ही नहीं,’ओं’ के प्रयोग से भी इनकी तिर्यक् प्रवृत्ति का बोध हो जाता है.यदि यहाँ ’ओ’ का प्रयोग होता तो यह संबोधनवाचक बहुवचन होता और उसके साथ किसी भी परसर्ग (के, में से आदि) के अनुप्रयोग की अनुमति नहीं है.जैसे,देवियो और सज्जनो..
अर्थपरक और वाक्यपरक लक्षण अप्रकट होते हैं अर्थात् ये लक्षण शब्दों में ही अंतर्निहित होते हैं.जैसे “बालक” शब्द चेतन, प्राणिवाचक, मानव और मूर्त संज्ञापद है.ये लक्षण “बालक” शब्द के अर्थपरक लक्षण हैं. शब्दकोश में इन लक्षणों के समावेश से असंगत वाक्यों के प्रजनन को भी रोका जा सकता है.जैसे “गाना” क्रिया प्राणिवाचक कर्ता की ही अपेक्षा करती है. इसलिए जब तक इसका कर्ता प्राणिवाचक न हो, तब तक इस क्रिया से निर्मित वाक्य संगत नहीं माना जा सकता. वाक्यपरक लक्षणों में ऐसे घटकों का समावेश होता है,जिनके प्रयोग के बिना वाक्य अधूरा या असंगत मालूम पड़ता है.जैसे,” राम श्याम से मिलता है.” यदि इस वाक्य में श्याम या किसी अन्य सहपात्र का उल्लेख न हो तो यह वाक्य अधूरा ही लगेगा. जैसे, ” *राम मिलता है.”

संबंधपरक उपागम दो शब्दों के बीच के संबंधों को उजागर करते हैं. यदि माँ-बाप और बच्चे के संबंध को लें तो ये इसप्रकार हो सकते हैं. जैसे, पिल्ला > बच्चा > कुत्ता
बछड़ा > बच्चा > गाय
इसीप्रकार अंग-अंगी संबंधों को भी इसप्रकार रखा जा सकता है :
पैर <>अंग-अंगी संबंध <>शरीर चोंच <>अंग-अंगी संबंध <>चिड़िया
पर्यायवाची शब्द भी (जैसे, पवन, समीर, वायु, हवा) भी इसी के अंतर्गत आते हैं. शब्दवृत्त (Lexicon) के अंतर्गत इसप्रकार के अनेक संबंधों को एक जालक्रम (Network) के रूप में इस प्रकार रखा जा सकता है :
ठंडा <>पर्याय<> शीतल ठंडा<> विलोम<> गरम चीता <>वर्ग
स्तनपायी<> पशु
खाना> प्रेरणा > खिलाना बछड़ा >शिशु >गाय
हाथ >अंग> शरीर
सोमवार> अनुक्रम> मंगलवार

ये सभी अभिलक्षण सर्वभाषा व्याकरण के अंतर्गत आते हैं. इसप्रकार जहां सर्वभाषा व्याकरण में भाषाविशिष्ट अभिलक्षणों की उपेक्षा हुई, वहीं हिंदी के परंपरागत व्याकरणों में भी हिंदी भाषा की बहुत कम भाषाविशिष्ट संरचनाओं की विवेचना की गई है.इस कमी को यदि किसी एक भाषावैज्ञानिक ने बहुत गंभीरता के साथ पूरा करने का प्रयास किया है तो वे हैं, प्रो.सूरजभान सिंह. प्रो.सिंह द्वारा लिखित “हिंदी का वाक्यात्मक व्याकरण” मील का ऐसा पत्थर है,जिसने न केवल हिंदी के समग्र व्याकरण की रूपरेखा हमारे सामने प्रस्तुत की है, बल्कि NLP के अंतर्गत हिंदी भाषा के संदर्भ में कंप्यूटरसाधित संश्लेषण, विश्लेषण और संसाधन का मार्ग भी प्रशस्त कर दिया है.इस आलेख के वक्ता ने प्रो.सिंह द्वारा वर्गीकृत हिंदी के बीज वाक्यसाँचों के आधार पर प्रो.अरविंद जोशी के नेतृत्व में अमरीका स्थित पेन्सिल्वानिया विश्वविद्यालय में हिंदी पार्सर के निर्माण में यत्किंचित् योगदान दिया था.प्रो.सिंह ने हिंदी-वाक्यों के अंतर्निहित तथा संरचनात्मक लक्षणों के विश्लेषण में सामान्यत : लक्षण-विश्लेषण या तत्व- विश्लेषण पद्धति का उपयोग किया है.वाक्यसाँचों के सभी घटक,अमूर्त रूप में, कुछ लक्षणों या तत्वों से मिलकर बने हैं और प्रत्येक वाक्य-साँचा लक्षणों का एक पुंज या संविन्यास है. समान प्रकार का लक्षण-संविन्यास समान प्रकार के वाक्य व्युत्पन्न करने की क्षमता रखता है.इन वाक्य-साँचों तथा उपवाक्य-साँचों से कुछ विशिष्ट प्रक्रियाओं द्वारा वाक्य व्युत्पन्न किए जा सकते हैं.यद्यपि प्रो.सिंह ने हिंदी भाषा के लिए कुल 14 वाक्य-साँचों और 45 उपवाक्य-साँचों की परिकल्पना की है,किंतु इस आलेख में केवल दो वाक्य-साँचों पर ही चर्चा की जाएगी, जिस पर अब भी हिंदी शिक्षकों का ध्यान नहीं गया है.ये वाक्य-साँचे हैं, को-वाक्य-साँचा और सहपात्रीय पूरकप्रधान ‘से’ परसर्ग से निर्मित अकर्मक क्रियाप्रधान वाक्य-साँचा. आम तौर पर आज भी हिंदी के शिक्षक ‘को” की परिकल्पना केवल कर्म के साथ जोड़कर ही करते हैं.जैसे,राम श्याम को पीटता है.लेकिन कर्ता के साथ व्युत्पन्न ‘को”वाक्यों पर हमारा ध्यान नहीं जाता,जबकि ‘को”वाक्य-साँचे से व्युत्पन्न वाक्यों का हिंदी में व्यापक प्रयोग किया जाता है.जैसे, ”राम को बुखार है”, “मुझे (मैं + को) बहुत काम है”, “राम को फुटबॉल का शौक है”, “राम को लड़कियों से नफ़रत है”.आदि.. ऐसे सभी वाक्यों को, जिनमें पूरक अथवा कोशीय क्रिया की आकांक्षा के कारण (लौकिक) कर्ता के साथ ‘को” परसर्ग का प्रयोग अनिवार्य हो, ‘को”वाक्य कहा जाता है. ‘को”कर्ता के दो अंतर्निहित (आर्थी) लक्षण महत्वपूर्ण हैं.(क ) चेतनता और (ख ) स्वेच्छा का अभाव. ‘को”-कर्ता के स्थान पर आने वाला संज्ञा शब्द चेतन तथा संवेदनशील होता है,क्योंकि ‘को” वाक्यों में प्राय : उसी श्रेणी की अनुभूतियों, मनोभावों तथा अमूर्त व्यापारों की अभिव्यक्ति होती है,जो प्राणिसुलभ हैं.कभी-कभी मानवीकरण के कारण मन, दिल आदि के साथ भी ‘को” का प्रयोग कर लिया जाता है. जैसे,”मेरे मन को बड़ा दु :ख हुआ.” इसीप्रकार को-वाक्य का सक्रिय कर्ता नहीं हो सकता, क्योंकि इसमें स्वेच्छा का अभाव होता है.प्रो. सिंह ने ऐसे सभी भावों या अर्थतत्वों को को –भाव कहा है, जो अपनी अभिव्यक्ति के लिए को-वाक्य की आकांक्षा करते हैं. प्रो.सिंह ने कुछ विशिष्ट आर्थी लक्षणों के आधार पर को-भावों का एक स्थूल वर्गीकरण किया है :

1.शारीरिक अनुभूति (बुखार,प्यास,नींद,पसीना,हँसी,छींक आदि)
शीला को प्यास लगी. राम को नींद /हँसी /छींक /आई.

2.बौद्धिक अनुभूति (ज्ञान / बोध) (आना,मालूम होना,याद आना)

सुधीर को हिंदी आती है.
शीला को यह मालूम है.
विजय को अक्सर अपने गाँव की याद आती है.

3.मनोभाव (दुःख,गुस्सा,आशा,नफ़रत आदि)

राम को यह खबर सुनकर बहुत दुःख हुआ.
पार्वती को अपनी सहेली पर बहुत गुस्सा आया.
पिता को बेटे से यही आशा थी.

4.पसंद /आदत (पसंद,शौक,दिलचस्पी,आदत आदि)

राम को फ़ुटबॉल का शौक है.
सुधीर को खीर बहुत पसंद है.

5. अमूर्त मानवीय व्यापार
5.1 ज़रूरत-वर्ग (ज़रूरत,आवश्यकता,इंतज़ार,खोज,चाहिए,तलाश,प्रतीक्षा आदि).
राम को नौकर की ज़रूरत है.
शीला को कार चाहिए. 5.2.उपलब्ध-वर्ग(उपलब्ध होना,नसीब होना,प्राप्त होना,मिलना,सुलभ होना)
राम को सब सुविधाएँ उपलब्ध / प्राप्त /सुलभ हैं.)

शीला को सौ रुपए मिले.

5.3 लाभ / हानि – वर्ग) (अभाव,कमी,क्षति,नुक्सान,बचत,हानि आदि)

सेठ जी को दस हज़ार रुपए का नुक्सान हुआ.
राम को इस साल अच्छी बचत हुई.

5.4 काम-वर्ग (अवकाश,काम,खतरा,जल्दी,मतलब,विलंब,फुर्सत आदि) मुझे आज बहुत काम है.
पिता जी को जल्दी है.
तुम्हें क्या मतलब?
मुझे फुर्सत नहीं है.

5.स्वीकार्य-वर्ग (मान्य,अमान्य,असह्य,स्वीकार्य आदि)

मुझे तुम्हारी शर्तें मान्य नहीं हैं.
तुम्हारी बातें मुझे असह्य लगती हैं.

6.बधाई-वर्ग (अधिकार,नमस्कार,प्रणाम,बधाई,शुक्रिया,छूट आदि)

जनता को बोलने का अधिकार है.
आपको बधाई हो.
पुलिस को गोली चलाने का आदेश है.

इससे यह स्पष्ट है कि हिंदी में ‘को-पूरक’ और ‘को-क्रिया’ के रूप में ‘को-भाव’ के प्रयोग की नियमित प्रवृत्ति है और यह भाषाविशिष्ट प्रवृत्ति है.यदि शब्दवृत्त (lexicon) में इन सभी शब्दों की प्रविष्टि करते समय इनमें अंतर्निहित सभी प्रकार के प्रकट और अप्रकट लक्षणों को भी शामिल कर लिया जाए तो सहजता से हिंदी का शब्द-व्याकरण तैयार हो जाएगा. सर्वभाषा व्याकरण के अनुसार कुछ अकर्मक क्रियाएँ ऐसी हैं जो अपने सहज अर्थों में कर्ता के साथ-साथ सहपात्र की आकांक्षा भी करती हैं,जैसे मिलना, लड़ना, झगड़ना, चिपटना, टकराना, डरना, कतराना, चिढ़ना आदि. इन क्रियाओं में सहपात्र के साथ कर्ता का संबंध साहचर्य का भी हो सकता है और पार्थक्य का भी. साहचर्यपरक क्रियाओं में कर्ता और सहकर्ता के बीच समस्तरीय संबंध होता है और यही कारण है कि उन्हें ‘ और’ संयोजक द्वारा भी जोड़ा जा सकता है. जैसे, ‘ राम श्याम से मिलता है.’ ‘ राम और श्याम मिलते हैं.’ इन वाक्यों में ‘आपस में’, ‘परस्पर’ , ‘एक-दूसरे से’ आदि क्रियाविशेषणों का भी प्रयोग किया जा सकता है.जैसे राम और श्याम आपस में / परस्पर / एक-दूसरे से मिलते हैं.’ लेकिन पार्थक्य की क्रियाओं में कर्ता और सहपात्र को ‘ और’ संयोजक द्वारा नहीं जोड़ा जा सकता.
जैसे, ‘ चोर पुलिस से डरता है.’ ‘*चोर और पुलिस डरते हैं.’
परंपरागत हिंदी व्याकरण में और सर्वभाषा व्याकरण में भी अपादान के रूप में निम्नलिखित वाक्यों में ‘से / from’ के प्रयोग की सार्वभौमिक प्रवृत्ति है.

जैसे, “पेड़ से पत्ते गिरते हैं”.(The leaves fall from the tree)
“हिमालय से गंगा निकलती है”.(Ganges flows from the Himalaya).
इसीप्रकार करण / Intrumental के रूप में भी “से” का प्रयोग सार्वभौमिक प्रवृत्ति है.जैसे, डाकू ने यात्री को तलवार से मार दिया / The decoit killed the passenger with a sword.किंतु हिंदी की एक भाषाविशिष्ट प्रवृत्ति यह भी है कि कुछ अकर्मक क्रियाओं के साथ ‘से’ का प्रयोग उनके नाभिकीय तत्व के रूप में अंतर्निहित होता है.जैसे निम्नलिखित वाक्यों को देखें:
‘राम श्याम से मिलता है.’
‘गोपाल राधा से लड़ता है.’
‘कार स्कूटर से टकरा गई. ’
‘बच्चा माँ से लिपट / चिपट गया. ’
‘चोर पुलिस से डरता है. ’
शीला अपने पति से रूठ गई. ’
इन सभी क्रियाओं में ‘से’ का प्रयोग अंतर्निहित है, जबकि यहाँ न तो अपादान का प्रयोग है और न ही करण का.यह हिंदी की भाषाविशिष्ट और नियमित प्रवृत्ति है,किंतु हिंदी के परंपरागत व्याकरणों की सहायता से आज भी छात्रों को कर्म के साथ ‘को’ और अपादान / करण के विभक्ति-चिह्न या परसर्ग के रूप में ‘से’ का प्रयोग पढ़ाया जाता है.प्रो.सिंह द्वारा वर्णित इस प्रकार के सूक्ष्म और अंतर्निहित भाषाविशिष्ट नियमों को प्राकृतिक भाषा संसाधन (NLP) के अंतर्गत प्रो.अरविंद जोशी द्वारा विकसित टैग (Tree-Adjoing Grammar) नामक कलन-विधि (algorithm) की सहायता से वर्ष 1996 में अमरीका के पेन्सिल्वानिया विश्वविद्यालय में एक ऐसा पदनिरूपक (Parser) विकसित करने का प्रयास किया गया था, जिसकी सहायता से न केवल असंगत हिंदी वाक्यों को प्रजनित होने से रोका जा सकता है,बल्कि एक ऐसा शब्दवृत्त भी तैयार किया जा सकता है,जिसमें इन सभी लक्षणों का समावेश हो.यद्यपि उक्त पार्सर का विकास कंप्यूटरसाधित अनुवाद प्रणाली के लिए किया गया था,किंतु इसकी क्षमता को देखते हुए हिंदी सीखने-सिखाने के लिए शब्दवृत्त भी विकसित किया जा सकता है.
माइक्रोसॉफ़्ट ने हाल ही में ‘विंडोज़ /ऑफ़िस हिंदी’ के रूप में एक ऐसी ऑपरेटिंग प्रणाली और ऑफ़िस पैकेज का विकास किया है,जिसमें हिंदी में कुंजीयन या टाइप करने के लिए उस बारहखड़ी का उपयोग किया है,जिसका प्रयोग हिंदी सीखने-सिखाने के लिए शताब्दियों से भारत के गाँव-गाँव में किया जाता रहा है.इसमें संदेह नहीं कि देवनागरी लिपि आज भी विश्व की सर्वाधिक वैज्ञानिक लिपि मानी जाती है,लेकिन हिंदीभाषियों के लिए हिंदी में टाइप करना आज भी टेढ़ी खीर है.इसलिए माइक्रोसॉफ़्ट ने एक वैकल्पिक कुंजीपटल के रूप में वेबदुनिया की सहायता से एक ऐसी IME (Input Method Editor) का विकास किया गया है,जिसमें रोमन लिपि की सहायता से ध्वन्यात्मक रूप में हिंदी के पाठ को टाइप किया जा सकता है.वस्तुत : यह कुंजीपटल उन लोगों के लिए अधिक उपयोगी है,जो रोमल लिपि में पहले से ही टाइप करना जानते हैं.इसकी एक झलक निम्नलिखित भाषापट्टी से देखी जा सकती है :
इसमें ‘म’ अक्षर से बनने वाले सभी शब्दों को बिना हिंदी टाइप जाने भी रोमन कुंजीपटल की सहायता से हिंदी में टाइप किया जा सकता है.यहाँ तक कि अगर आप मृ भी लिखना चाहते हैं तो भी इस पट्टी को देखकर पता लगा सकते हैं कि ऋ की मात्रा कैपिटल R से लिखी जा सकती है.आप जो भी शब्द टाइप करना चाहते हैं,उसका पहला अक्षर रोमन लिपि में टाइप करें.जैसे आप ‘भारत’ लिखना चाहते हैं तो आप जैसे ही b टाइप करेंगे तो ‘ब’ की बारहखड़ी स्क्रीन पर आ जाएगी और आपको स्क्रीन पर ‘भ’ टाइप करने के लिए ‘bh’ दिखाई पड़ेगा.फिर ‘आ’ की मात्रा के लिए aa और ‘भारत’ लिखने के लिए रोमन लिपि में ‘bhaarat’ टाइप करें.इसप्रकार यह विधि पूरी तरह से ध्वन्यात्मक है.आप जिस क्रम से बोलते हैं,उसी क्रम से टाइप भी करेंगे.उदाहरण के लिए हिंदी में इ की मात्रा लिखी तो पहले जाती है,लेकिन उसका उच्चारण बाद में होता है.उदाहरण के लिए यदि आपको ‘स्त्रियाँ’ लिखना है तो आप ‘striyaa^’ टाइप करेंगे.
हिंदी की यह विशेषता है कि इसमें अल्पप्राण और महाप्राण का युग्म साथ-साथ रहता है.ध्वन्यात्मक लिप्यंतरण (Phonetic Transliteration) नामक इस कुंजीपटल से ‘क’ लिखने के लिए आप ‘k’ टाइप करते हैं और ‘ख’ लिखने के लिए ‘kh’.’ग’ लिखने के लिए ‘g’ और ‘घ’ के लिए ‘gh’ टाइप करते हैं. इसप्रकार दूसरी या विदेशी भाषा के रूप में हिंदी सीखने वालों को ‘h’ के माध्यम से महाप्राणत्व का बोध हो जाता है.हिंदी में यह ध्वनि अर्थभेदक है. भारत में भी अहिंदीभाषियों के लिए विशेषकर तमिलभाषियों के लिए यह विधि हिंदी सीखने में काफ़ी मददगार सिद्ध हुई है.
अंत में निष्कर्ष के रूप में यही कहा जा सकता है कि यदि हिंदी में शब्द-व्याकरण के विकास के लिए प्राकृतिक भाषा संसाधन (NLP) की तकनीक का उपयोग किया जाए तो हिंदी सीखने-सिखाने के लिए एक उपयुक्त शब्दवृत्त विकसित किया जा सकता है,जिससे हिंदी शब्दों में निहित सार्वभौमिक और भाषाविशिष्ट प्रवृत्तियों को अनायास ही अनावृत किया जा सकेगा.