युनिकोड (रोमन लिपी: Unicode) हा आंतरराष्ट्रीय पातळीवर प्रमाणभूत होत असलेला असा एक वर्णसंच आहे.
ह्या लेखाला एकही संदर्भ दिला गेलेला नाही. विश्वसनीय स्रोत जोडून या लेखातील माहितीची पडताळणी करण्यात मदत करा. संदर्भ नसल्याने प्रस्तुत लेखाची उल्लेखनीयता ही सिद्ध होत नाही. संदर्भहीन मजकूराची पडताळणी करता येत नसल्याने व उल्लेखनीयता सिद्ध होत नसल्याने हा लेख काढून टाकला जाऊ शकतो याची नोंद घ्यावी. |
'कॅरॅक्टर एनकोडिंग' ह्या संज्ञेची अगदी सोपी व्याख्या म्हणजे ‘कोणत्याही एका मानवी भाषेतील सर्व अक्षरे, चिन्हे यांना काही विशिष्ट क्रमाने ठरवून दिलेले गणितीय आकडे’.
येथे (२१,२२,२३,२४,२५) ह्या आकड्यांच्या समूहाचे ('क', 'ख, 'ग', 'घ, 'ञ') ह्या पाच अक्षरांच्या समूहाशी आपण जे नाते ठरवले त्यास एक कॅरॅक्टर संच म्हटले जाते.
हेच उदाहरण पुढे वाढवल्यास मराठीतील १२ स्वर आणि ३६ व्यंजन अक्षरे ही एकूण ४८ आकड्यांनी ओळखता येतील. असे केल्यास हा नवीन कॅरॅक्टर संच एकूण ४८ अक्षरांना आकड्यांचे स्वरूप देईल.
असे करण्याचे एकच कारण आहे व ते म्हणजे संगणकास कोणत्याही भाषेचे ज्ञान नसते. संगणकावर साठवलेली सर्व माहिती ही केवळ आकड्यांच्या स्वरूपात साठवलेली असते. त्याचप्रमाणे संगणकास समजणारी सर्व आज्ञावली हीदेखील आकड्यांच्याच स्वरूपात साठवली जाते.
उदा. cat हा शब्द आस्कीमध्ये ९९ ९७ ११६ ह्या तीन आकड्यांत साठवला जातो; तर Cat हा शब्द ६७ ९७ ११६ असा साठवला जातो. 'Windows 95' हा मजकूर '८७ १०५ ११० १०० १११ ११९ ११५ ३२ ५७ ५३' असा होईल व संगणकात साठवला जाईल. आस्कीप्रमाणे इतर अनेक कॅरॅक्टर सेट्स प्रचलित असून बहुतांश देशांमध्ये त्या देशाच्या भाषेप्रमाणे कोणतातरी एक कॅरॅक्टर संच प्रमाण मानला जातो. भारतीय भाषांकरिता प्रमाण कॅरॅक्टर सेट इस्की (इस्की) हा आहे. (हा भारतीय सरकारद्वारे साधारणतः १९८० च्या दशकात विकसित करण्यात आला)
असाच एक कॅरॅक्टर सेट म्हणजे युनिकोड.
आस्की किंवा इस्की यांसारखे कॅरॅक्टर सेट फक्त ठरावीक भाषेसाठी ठरवण्यात आले आहेत. भारतीय भाषांसाठी जरी 'इस्की' संच असला तरी तो 'आस्की'चेच रूप आहे. कारण 'आस्की'ला फक्त इंग्रजीलाच बरोबर घेऊन पुढे जायचे होते, तर 'इस्की'ला देवनागरीसह इंग्रजीला घेऊन पुढे जायचे होते. जगातील सर्व भाषांचा संगणकावर वापर करता यावा व सर्व भाषा एकाच कॅरॅक्टर सेटमध्ये वापरता याव्यात यासाठी युनिकोडची निर्मिती करण्यात आली.
(The en:Unicode range for Devanāgarī is U+0900 .. U+097F.)
राखाडी रंगाचा ठोकळा अक्षरांसाठी सध्या रिकामी ठेवलेली घरे दाखवतो.
जर तुम्हाला सर्व अक्षरे योग्य प्रकारे दिसत नसतील तर ही pdf संचिका डाउनलोड करा (उतरवून घ्या)
देवनागरी युनिकोड | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
U+090x | ऀ | ँ | ं | ः | ऄ | अ | आ | इ | ई | उ | ऊ | ऋ | ऌ | ऍ | ऎ | ए |
U+091x | ऐ | ऑ | ऒ | ओ | औ | क | ख | ग | घ | ङ | ङ | च | छ | ज | झ | ञ |
U+092x | ट | ठ | ड | ढ | ण | त | थ | द | न | ऩ | प | फ | ब | भ | म | य |
U+093x | र | ऱ | ल | ळ | ऴ | व | श | ष | स | ह | ऻ | ऽ | ा | ि | ी | ु |
U+094x | ू | ृ | ॄ | ॅ | ॆ | े | ै | ॉ | ॊ | ो | ौ | ् | ॎ | ॏ | ॐ | ॒ |
U+095x | ॓ | ॔ | ॕ | ॖ | ॗ | क़ | ॖ | ॗ | क़ | ख़ | ग़ | ज़ | ड़ | ढ़ | फ़ | य़ |
U+096x | ॠ | ॡ | ॢ | ॣ | । | ॥ | ० | १ | २ | ३ | ४ | ५ | ६ | ७ | ८ | ९ |
U+097x | ॰ | ॱ | ॲ | ॳ | ॴ | ॵ | ॶ | ॷ | ॸ | ॹ | ॺ | ॻ | ॼ | ॽ | ॾ | ॿ |
जर तुम्हाला सर्व अक्षरे योग्य प्रकारे दिसत नसतील तर ही pdf-२ संचिका डाउनलोड करा (उतरवून घ्या)
↓ ☸ → | ० | १ | २ | ३ | ४ | ५ | ६ | ७ | ८ | ९ | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
u+A8Ex | ꣠ | ꣡ | ꣢ | ꣣ | ꣤ | ꣥ | ꣦ | ꣧ | ꣨ | ꣩ | ꣪ | ꣫ | ꣬ | ꣭ | ꣮ | ꣯ |
u+A8Fx | ꣰ | ꣱ | ꣲ | ꣳ | ꣴ | ꣵ | ꣶ | ꣷ | ꣸ | ꣹ | ꣺ | ꣻ |
जर तुम्हाला सर्व अक्षरे योग्य प्रकारे दिसत नसतील तर ही pdf-३ संचिका डाउनलोड करा (उतरवून घ्या)
साचा:Unicode chart Vedic Extensions
टंक म्हणजे font. देवनागरी लिपीसाठी हजारो टंक उपलब्ध आहेत.
काही अक्षरे ही दोन युनिकोड जोडून तयार करावी लागतात, परंतु काही अक्षरांना स्वतःचा युनिकोड असतो, तरीही बऱ्याचदा ही अक्षरे चुकीची लिहिली जातात. जसे की ॲच्या जागी ऍ (ही चूक स्वतः wikipedia मध्ये करण्यात आली आहे ).(ही चूक कशी? ऍ हे अक्षर मराठीत नाही, अॅ (‘अ’ वर चंद्र) हे आहे.
अक्षर | युनिकोड | ! |
---|---|---|
ॲ | U0972 | मराठी अक्षर. |
ॐ | U0950 | |
ऍ | U090D | हिंदी अक्षर |
क + ् + ष = क्ष
ज + ् + ञ = ज्ञ
ऱ +् + य = ऱ्य
(वरील चूक स्वतः wikipedia मध्ये करण्यात आली आहे. ऱ्यच्या जागी ऱ्य ).
.)
ऱ +् + ह = ऱ्ह
(वरील चूक स्वतः wikipedia मध्ये करण्यात आली आहे. ऱ्हच्या जागी ऱ्ह ).
.)
क + ् + र = क्र
प + ् + र = प्र
क + ् + क + ् + य = क्क्य
त + ् + र = त्र
र +् + क = र्क
र + ् + व = र्व
ब + ृ = बृ
व्यंजनाला पायाशी लावलेले हलन्त(पाय मोडायचे) चिन्ह त्या व्यंजनाचा निभृत(स्वरहीन) उच्चार करावा असे सूचित करते. अशा हलन्त व्यंजनापाठोपाठ दुसरे व्यंजन आले की जोडाक्षर बनते.जोडाक्षर झाल्यामुळे पहिले हलन्त व्यंजन तसे रहात नाही. पण कधीकधी हे पायमोडके अक्षर दिसावे अशी आपली इच्छा असते. अशा वेळी ’अक्षर विलगक’(ZWNJ-Zero Width Non-joiner) वापरून एका पायमोडक्या व्यंजनाशेजारी दुसरे व्यंजन टंकित करता येते. हे साध्य करण्यासाठी युनिकोडने U+200C या संकेताक्षराची योजना केली आहे.
उदा०
या उलट कधीकधी दोन्ही व्यंजने आडव्या बांधणीने जोडली जावी अशी आपली इच्छा असते. अशा वेळी ’अक्षर सांधक’((ZWJ-Zero Width Joiner) लागतो. युनिकोडने त्यासाठी U+200D या कोडची योजना केली आहे. (कधीकधी अक्षरे उभ्या जोडणीने जोडली जावी अशीही आमची इच्छा असते, त्यासाठी युनिकोडने काय सोय केली आहे?)
जर अक्षर-सांधक किंवा विलगक वापरला नाही तर,
आणि,
This article uses material from the Wikipedia मराठी article युनिकोड, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). इतर काही नोंद केली नसल्यास,येथील मजकूर CC BY-SA 4.0च्या अंतर्गत उपलब्ध आहे. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki मराठी (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.