المعرف الكيميائي الدولي (بالإنجليزية: IUPAC International Chemical Identifier) ويرمز له (InChI) وتلفظ (إنشي) وهي تعريفات نصية للمواد الكيميائية، مصممة لكي تعطي طريقة معيارية مقروءة بشريا تستخدم لتشفير المعلومات الجزيئية بحيث تسهل البحث عن هذه المعلومات في قواعد البيانات، وعلى الشبكة العنكبوتية.
وقد طورها الاتحاد الدولي للكيمياء البحتة والتطبيقية والمعهد الوطني للمعايير والتقنية (المعهد الوطني للمعايير والتقنية) خلال الأعوام 2000-2005، حيث الشكل والخوارزميات غير مسجلة الملكية والبرمجيات مجانية تحت رخصة مفتوحة المصدر LGPL (رغم أن مصطلح "InChI" هي علامة تجارية للاتحاد الدولي للكيمياء البحتة والتطبيقية).
تصف المعرفات المواد الكيميائية باعتبارها «طبقات» من المعلومات، تتعلق بالذرات وروابطها، ومعلومات المماثل الكيميائي (tautomer)، ومعلومات النظائر، والكيمياء الفراغية، والمعلومات عن الشحنة الإلكترونية. ليس من الواجب تقديم جميع الطبقات؛ على سبيل المثال، يمكن إغفال طبقة المماثل الكيميائي إذا كان هذا النوع من المعلومات غير متصل بتطبيق معين.
تختلف المعرفات الكيميائية الدولية عن أرقام التسجيل كاس في عدد من الجوانب وهي:
يمكن النظر إلى إنشي على أنها نسخة رسمية وعامة للغاية من تسمية الاتحاد الدولي للكيمياء البحتة والتطبيقية. يمكن للمعرفات الكيميائية الدولية التعبير عن مزيد من المعلومات مقارنة بترميز مواصفات الإدخال النصي المبسط للجزيئات، وتختلف في أن كل بنية هيكلية لها سلسلة إنشي وحيدة وهو أمر هام في تطبيقات قواعد البيانات. المعلومات عن الإحداثيات ثلاثية الأبعاد للذرات غير ممثلة في الإنشي، ولهذا الغرض يمكن استخدام نمط مثل بنك معلومات البروتينات.
إن خوارزمية إنشي تحول المعلومات الهيكلية المدخلة إلى معرف إنشي وحيد في عملية ثلاثية الخطوات: التسوية (normalization) (لإزالة المعلومات الزائدة)، التمثيل القانوني (canonicalization) (لتوليد عنوان عددي وحيد لكل ذرة)، والتسلسل (serialization)(لتقديم سلسلة من الحروف).
إن مفتاح الإنشي (InChIKey)، ويشار إليه أحيانا (Hashed InChI)، هو تمثيل رقمي مكثف ثابت الطول (25 محرفا) للإنشي لايمكن للإنسان فهمه. وقد أصدرت مواصفات مفتاح الإنشي في أيلول 2007 من أجل تسهيل عمليات البحث على الشبكة العالمية عن المركبات الكيميائية، لأنها كانت تسبب بعض المشاكل مع الطول الكامل للإنشي.
CH3CH2OH إيثانول | InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
L-حمض الأسكوربيك | InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |
يبدأ كل إنشي بالشكل المحرفي "InChI =" يليه رقم النسخة، وهي حاليا 1. تنظم بقية المعلومات وفق سلسلة من الطبقات والطبقات الثانوية، حيث تقدم كل طبقة نوعا واحدا ومعينا من المعلومات. يفصل خط مائل طبقات "/" بين الطبقات والطبقات الثانوية، وتبدأ بحرف معين ومميز (باستثناء الطبقة الثانوية للصيغة الكيميائية للطبقة الرئيسية). إن الطبقات الست مع الطبقات الثانوية الهامة هي:
الحرف البادئ المحدد له ميزة أنه يمكن للمستخدم بسهولة البحث وفق المحارف لإيجاد المعرفات التي تتطابق فقط في بعض الطبقات.
This article uses material from the Wikipedia العربية article المعرف الكيميائي الدولي, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). المحتوى متاح وفق CC BY-SA 4.0 ما لم يرد خلاف ذلك. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki العربية (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.