याहा कोहि Unicode), प्रत्येक अक्षर को लागि एक विशेष संख्या प्रदान गर्दछ, चाहे कुनै पनि कम्प्युटर प्लेटफर्म, प्रोग्राम अथवा कुनै पनि भाषा हो। यूनिकोड स्टैंडर्ड को एपल, एच.पी., आई.बी.एम., जस्ट सिस्टम, माइक्रोसफ्ट, ओरेकल, सैप, सन, साईबेस, यूनिसिस जस्तो उद्योग को प्रमुख कम्पनिहरु र धेरै अन्य ले अपनाएको छ। यूनिकोड को आवश्यकता आधुनिक मानदंडों, जस्तै एक्स.एम.एल, जावा, एकमा स्क्रिप्ट (जावास्क्रिप्ट), एल.डी.ए.पी., कोर्बा 3.0, डब्ल्यू.एम.एल को लागि हुन्छ र यो आई.एस.ओ/आई.ई.सी.
Unicode |
---|
UCS |
UTF-7 |
UTF-8 |
UTF-16 |
UTF-32 |
UTF-EBCDIC |
SCSU |
Punycode |
GB18030 |
Bi-directional text |
BOM |
Han unification |
Unicode and HTML |
10646 को लागू गर्ने अधिकारिक तरीका छ। यो धेरै सञ्चालन प्रणालिहरु, सबै आधुनिक ब्राउजरों र धेरै अन्य उत्पादनहरु मा हुन्छ। यूनिकोड स्टैंडर्ड को उत्पति र यसको सहायक उपकरणहरू को उपलब्धता, हाल नै को अति महत्त्वपूर्ण विश्वव्यापी सफ्टवेयर प्रौद्योगिकी रुझानों मध्ये छन्।
यूनिकोड को ग्राहक-सर्भर अथवा बहु-आयामी उपकरणहरू र वेबसाइटों मा शामिल गर्न से, परम्परागत उपकरणहरू को प्रयोग गरे अपेक्षा खर्च मा अत्यधिक बचत हुन्छ। यूनिकोड भन्दा एक यस्तो एक्लो सफ्टवेयर उत्पादन अथवा एक्लो वेबसाइट मिलछ, जसलाई री-इंजीनियरिंग को बिना विभिन्न प्लेटफर्महरु, भाषाहरु र देशहरू मा उपयोग गरिन सक्छ। यसले आँकडहरूलाई बिना कुनै बाधा को विभिन्न प्रणालिहरूसँग भएर ले जाया जान सक्छ।
यूनिकोड प्रत्येक अक्षर को लागि एक विशेष नम्बर प्रदान गर्दछ,
कम्प्युटर, मूल रूप मा, नम्बरसग सम्बंध राख्छ। यो प्रत्येक अक्षर र वर्ण को लागि एक नम्बर निर्धारित गरेर अक्षर र वर्ण सङ्ग्रहित गर्छन। यूनिकोड को आविष्कार होने भन्दा पहिले, यस्तो नम्बर दिन को लागि सैंकडों विभिन्न सङ्केत लिपि प्रणालिहरु थिए। कुनै एक सङ्केत लिपि मा पर्याप्त अक्षर हैन हुन सक्छन् : उदाहरण को लिए, यूरोपीय सङ्घ को एक्लै ही, आफ्नो सबै भाषाहरु को कवर गर्न को लागि अनेक विभिन्न सङ्केत लिपिहरु को आवश्यकता हुन्छ। अङ्ग्रेजी जस्तो भाषा को लागि पनि, सबै अक्षरहरु, विरामचिन्हों र सामान्य प्रयोग को प्रौद्योगिकी प्रतीकहरु हेतु एक नै सङ्केत लिपि पर्याप्त थिएन।
यो सङ्केत लिपि प्रणालिहरु मास्पर विरोधी पनि छन्। यसैको लागि, दुइ सङ्केत लिपिहरु दुइ विभिन्न अक्षरहरु को लिए, एक नै नम्बर प्रयोग गर्न सक्छं, अथवा समान अक्षर को लागि विभिन्न नम्बरहरूको प्रयोग गर्न सक्छं। कुनै पनि कम्प्युटर (विशेष रूप ले सर्वर) को विभिन्न सङ्केत लिपिहरु संभालनी पडती है; फेरि पनि जब दुइ विभिन्न सङ्केत लिपिहरु अथवा प्लेटफर्मों को बीच डाटा पठाइन्छ त उन डाटा को संधै खराब भएको जोखिम रहन्छ।
यूनिकोड देखि यो सबै केहि बदल रहेको छ !
१) यो विश्व को सबै लिपिहरूसँग सबै संकेतहरु को लागि एक अलग कोड बिन्दु प्रदान गर्दछ।
२) यो वर्णहरु (कैरेक्टर्स) को एक कोड दिइन्छ, न कि ग्लिफ (glyph) को।
३) जहाँ पनि सम्भव यूनिकोड हुन्छ, यो भाषाहरु को एकीकरण गर्ने प्रयत्न गर्दछ। त्यहि नीति को तहत सबै पश्चिम यूरोपीय भाषाहरु को लैटिन को अन्तर्गत समाहित गरिएको छ; सबै स्लाविक भाषाहरु को सिरिलिक (Cyrilic) को अन्तर्गत राखाइएको छ; हिन्दी, संस्कृत, मराठी, नेपाली, सिन्धी, कश्मीरी आदि को लागि 'देवनागरी' नाम ले एक नै ब्लक दिइएको छ; चीनी, जापानी, कोरियाई, वियतनामी भाषाहरु को 'युनिहान्' (UniHan) नाम ले एक ब्लक मा राखाइएको छ; अरबी, फारसी, उर्दू आदि को एक नै ब्लक मा राखाइएको छ।
४) बायाँ भन्दा दायाँ लिखी जाने वाला लिपिहरु को अतिरिक्त दाएँ-से-बाएँ लिखी जाने वाला लिपिहरु (अरबी, हिब्रू आदि) को पनि यसमा शामिल गरिएको छ। माथि देखि तल को तर्फ लिखी जाने वाला लिपिहरु को अझै अध्ययन गरे जा रहेको छ ।
५) यो ध्यान राख्न जरूरी छ कि यूनिकोड केवल एक कोड-सारणी छ। यि लिपिहरु लाई लिख्न/पढ्ने क लागि इनपुट मेथड एडिटर र फण्ट-फाइल जरूरी छ।
५) यूनिकोड १६ बिट्स को एक ईकाई को रूप मा लेकर चल्छ।
यूनिकोड, आस्की तथा अन्य कैरेकटर कोडों को अपेक्षा अधिक स्मृति (मेमोरी) लिन्छ। कितनी अधिक स्मृति लगेगी यो यस कुरा मा निर्भर गर्दछ कि तपाईँ को सा यूनिकोड प्रयोगएर रहे छन्। UTF७, UTF८, UTF१६ या वास्तविक यूनिकोड - एक अक्षर अलग-अलग बाइट प्रयोग गर्छन।
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+090x | ँ | ं | : | ऄ | अ | आ | इ | ई | उ | ऊ | ऋ | ऌ | ऐ | ऐ | ए | |
U+091x | ऐ | ओ | ओ | ओ | औ | क | ख | ग | घ | ङ | च | छ | ज | झ | ञ | ट |
U+092x | ठ | ड | ढ | ण | त | थ | द | ध | न | ऩ | प | फ | ब | भ | म | य |
U+093x | र | र | ल | ळ | ल | तथा | श | ष | स | ह | ऽ | ा | ि | |||
U+094x | ु | ू | ृ | ॄ | े | े | े | ै | ो | ो | ौ | ् | ||||
U+095x | ॐ | ॑ | ॒ | ॓ | ॔ | क | ख | ग | ज | ड | ढ | फ | य | |||
U+096x | ॠ | ॡ | ॢ | ॣ | । | ॥ | ० | १ | २ | ३ | ४ | ५ | ६ | ७ | ८ | ९ |
U+097x | ॰ | ॲ | ग॒ | ज॒ | ड॒ | ब॒ |
यूनिकोड कन्सर्शियम, एक लाभ न कमाने वाला एक सङ्गठन हो जसको स्थापना यूनिकोड स्टैंडर्ड, जो आधुनिक सफ्टवेयर उत्पादनहरु र मानकहरु मा पाठ को प्रस्तुति को निर्दिष्ट गर्दछ, को विकास, विस्तार र यसको प्रयोग लाई बढावा दिन को लागि गरिएको थियो। यस कन्सर्शियम को सदस्यहरु मा, कम्प्युटर र सूचना उद्योग मा विभिन्न निगम र सङ्गठन शामिल छन्। यस कन्सर्शियम को वित्तपोषण पूर्णतः सदस्यहरु को शुल्क देखि गरिन्छ। यूनिकोड कन्सर्शियम मा सदस्यता, विश्व मा कहीं पनि स्थित उन सङ्गठनहरु र व्यक्तिहरु को लागि खुली छ जो यूनिकोड को समर्थन गर्छन र जो यसको विस्तार र कार्यान्वयन मा सहायता गर्न चाहते छन्।
यदि कुनै लेख कुनै ठाँउ मा कुनै यस्तो फंन्ट को प्रयोगएर को लेखाइएको छ जो कि यूनिकोड छैन त फन्ट परिवर्तक प्रोग्रामहरूको प्रयोग गरेर उसलाई यूनिकोड मा बदलन सकिन्छ।
विस्तृत जानकारी को लागि हेर्नुहोस - 'फण्ट परिवर्तक'
याहू जस्तै इमेल सेवाहरू मा यूनिकोड कैरेक्टर विकृत भए पछि मूल इमेल प्राप्त गरेर पढने को ओनलाईन औजार
This article uses material from the Wikipedia नेपाली article युनिकोड, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). सामाग्री CC BY-SA 4.0 अनुसार उपलब्ध छ, खुलाइएको अवस्था बाहेकको हकमा। Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki नेपाली (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.