యూనికోడ్ – తెలుగు 

-డా||కె.గీత 

కిందటి నెలలో తెలుగు టైపు ప్రాథమిక దశ గురించి చెప్పుకున్నాం కదా! కీ బోర్డుల గురించి ప్రధాన విషయాలు తెలుసుకోవడానికి ముందు తెలుగు టైపులో యూనికోడ్ అనే అంశం గురించి తెలుసుకుందాం.  

అసలు యూనికోడ్  అంటే ఏవిటి, అవసరం ఏవిటి అనేది చూస్తే తెలుగు లిపిని టైపు రైటర్ల మీద టైపు కొట్టినట్టు కంప్యూటర్ లో టైపు కొట్టగలిగినా ఇంతకు ముందు చెప్పినట్లు ఒక చోట టైపు చేసి ఫైళ్లలోదాచుకున్నది మరో చోట చదవాలంటే అన్ని చోట్లా తెలుగు లిపికి సంబంధించిన సపోర్టు ఉండాలి. అంతెందుకు టైపు కొట్టినది మార్జిన్లు వగైరా ఏ మాత్రం చెడకుండా ఉండేందుకు వాడే పిడిఎఫ్(PDF-Portable Document Format) రూపంలోకి తెలుగు లిపిలో టైపు కొట్టిన ఫైలుని మార్చాలన్నా సపోర్టు ఉండాలి. 

1991 లో పేపరు నుండి డిజిటల్ రూపంలోకి ఫైళ్లని మార్చడానికి పిడిఎఫ్ ని అడోబీ (Adobe) ప్రపంచానికి పరిచయం చేసింది. ఇలా మార్చేటపుడు కాగితమ్మీద ఉన్న ప్రతి చిన్న వివరం అచ్చు గుద్దినట్టు  బొమ్మగా మార్చగలుగుతుంది ఈ పిడిఎఫ్. అయితే తొలినాళ్లలో తెలుగు లిపిలో ఒక చోట టైపు కొట్టగలిగినా ప్రింటు తీసుకోవడానికి, కంప్యూటరులోనే మరే చోటి నుంచయినా తిరిగి ఫైలు తెరిచి చదవడానికి కుదిరేది కాదు. అంటే తలకట్లు దీర్ఘాలే కాదు అసలు ఏ భాషో తెలీని వింత రాతలు, డబ్బాలు కనిపించేవి. ఇందుకు కారణం ఏవిటంటే ఇంతకు ముందు చెప్పుకున్నట్టు  ఒక కంప్యూటర్ నుండి ఇంకొక కంప్యూటర్‌కు డేటా ఇచ్చి పుచ్చుకొనేందుకు వీలుగా ఉండేందుకు ఒక్కొక్క అక్షరానికి ఇవ్వవలసిన స్థిరీకరణ కోడ్‌ అన్ని చోట్లా పనిచేసే కోడ్‌ కాదన్న మాట. 

యూనికోడ్ కాని అక్షరాలు ఎలా కనిపిస్తున్నాయో ఉదాహరణ చూడండి: 

“తొలితరం తెలుగు వెబ్‌ సైట్లు ముందు పేజ్‌ మేకర్‌ అనే డీటీపీ సాఫ్టువేర్‌ వాడి, సదరు పేజిని ఒక చిత్ర రూపంలో సేవ్‌ చేసి అప్పుడు వెబ్‌ పేజీలో పెట్టాల్సి వచ్చేది. లేకుంటే ఆ పేజ్‌ మేకర్‌ ఫైలును పిడీఎఫ్‌ ఫైలుగా మార్చి అయినా ఇంటర్నెట్‌ లో పెట్టాల్సి వచ్చేది. అప్పటికే డీటీపీ రంగంలో ప్రజాదరణ పొందిన అను ఫాంట్స్‌, శ్రీలిపి ఫాంట్స్‌నే వెబ్‌ సైట్లకొరకు కూడా వాడేవారు. దీని వల్ల చాలా సమస్యలు ఎదురయ్యేవి. మొదటిది, ఇలా ప్రతీది చిత్ర రూపంలోనో, పీడిఎఫ్‌ లోనో పెట్టడం వల్ల ఫైలు సైజు విపరీతంగా పెరిగిపోయి పాఠకులకు ఆ పేజి చాలా ఆలస్యంగా డౌన్‌ లోడ్‌ అయ్యేది. ఒకసారి చిత్రంలా మార్చిన దానిలో మార్పులు చేర్పులు చేసే అవకాశం వుండేది కాదు. ఇక డీటీపీ సాఫ్టువేర్‌ లో కీబోర్డ్‌ కొంచెం క్లిష్టంగా వుండటం వల్ల దాంట్లో టైపు చెయ్యడం చాలమందికి కష్టమయ్యేది.

ప్రభుత్వరంగ సంస్థ అయిన ‘సి డాక్‌’ ఈ రంగంలో చాలా కృషి చేసి అన్ని భారతీయ భాషల్లోను పని చేసే ఫాంట్స్‌ తో కూడిన ఐ-లీప్‌ అనే పాకేజీని అభివృద్ధి పరచింది. కాని ఎందుకో అది అంతగా ప్రాచుర్యం పొందలేదు. బహుశా ఐ-లీప్‌ సాఫ్ట్‌ వేర్‌ డబ్బులు పెట్టి కొనుక్కోవలసిరావడం ఇది అంతగా ప్రాచుర్యం పొందకపోవడానికి కారణమయి ఉంటుంది.

కొంత కాలానికి తెలుగు వార్తా పత్రికలు ఎవరికి వారు డైనమిక్‌ ఫాంట్లు అభివృద్ధి పరచుకోవడం మొదలుపెట్టారు. వీటి వల్ల సమస్య కొంచెం పరిష్కారం అయినా, అందరికీ ఈ డైనమిక్‌ ఫాంట్లు వాడే వీలు లేకపోవడం, కీబోర్డ్‌ అంతగా సులువుగా లేకపోవడం వల్ల ఈ టెక్నాలజీ కొన్ని ఇంటర్నెట్‌ పత్రికల దగ్గరే ఆగిపోయింది.

ఇప్పుడు యూనికోడ్‌ టెక్నాలజీ ప్రాచుర్యంలోకి వచ్చింది. దీని గొప్పతనం ఏమిటంటే ఇది ఉపయోగించి ఏ భాషలోనైనా టైపు చెయ్యవచ్చు, దానిని ఇతర కంప్యూటర్లకు పంపించవచ్చు, వెబ్‌ పేజీలు తయారు చెయ్యవచ్చు. మైక్రోసాఫ్ట్‌ విండోస్‌ 2000 నుంచి పూర్తిగా యూనికోడ్‌ ను సపోర్టు చెయ్యడం మొదలవటంతో ఇక ఈ రంగంలో కదలిక మొదలైంది.” (కొణతం దిలీప్‌, తెలంగాణా మాస పత్రిక) 

సూక్ష్మంగా చెప్పాలంటే యూనీకోడ్ అంటే అన్ని చోట్లా పనిచేసే  స్థిరీకరణ కోడ్‌ అన్న మాట. దీన్నే తెలుగులో సర్వ సంకేత పద్ధతి అని, ఏకరూప సంకేత పద్ధతి అని అంటున్నారు.

“కంప్యూటర్లు ప్రధానంగా అంకెలతో పని చేస్తాయి. ఒక్కో అక్షరానికీ, వర్ణానికీ ఒక్కో సంఖ్యని కేటాయించి నిక్షిప్తం చేసుకొంటాయి. యూనీకోడ్ కనుగొనబడక ముందు, ఈ విధంగా సంఖ్యలని కేటాయించడంకోసం వందలకొద్దీ సంకేతలిపి (encoding) పద్ధతులు ఉండేవి. ఏ ఒక్క పద్ధతిలోనూ చాలినన్ని వర్ణాలు ఉండేవికాదు: ఉదాహరణకు, ఒక్క ఐరోపా సమాఖ్య లోని భాషలకోసమే చాలా సంకేతలిపి పద్ధతులు కావలసి వచ్చేవి. అంతెందుకు, ఒక్క ఇంగ్లీషు భాషలోని అన్ని అక్షరాలు, సాధారణ వాడుకలో ఉన్న వ్యాకరణ, సాంకేతిక వర్ణాలకే ఏ ఒక్క సంకేతలిపి పద్ధతీ సరిపోయేది కాదు.

ఆ సంకేతలిపి పద్ధతుల మద్య వైరుధ్యాలుకూడా ఉండేవి. అంటే, వేర్వేరు పద్ధతులు ఒక సంకేతసంఖ్యని వేర్వేరు అక్షరాలకు, లేదా వేర్వేరు సంకేతసంఖ్యల్ని ఒకే అక్షరానికి ఉపయోగించేవి. కంప్యూటర్లు (ముఖ్యంగా సర్వర్లు) చాలా రకాలైన సంకేతలిపి పద్ధతులకు అనువుగా ఉండవలసి వచ్చేది; అయినా సరే, వివిధ సంకేతలిపి పద్ధతుల లేదా ప్లాట్‌ఫామ్ ల మధ్య డేటా ప్రయాణించినప్పుడు, ఆ డేటా చెడిపోయే ప్రమాదం ఎప్పుడూ పొంచి ఉండేది.

ప్రతీ అక్షరానికీ ఓ ప్రత్యేక సంఖ్యని యూనీకోడ్ అందిస్తుంది. ప్లాట్‌ఫామ్ ఏదైనా, ప్రోగ్రామ్ ఏదైనా, భాష ఏదైనా సరే. ఒకే సాఫ్ట్‌వేర్ ఉపకరణము లేదా ఒకే వెబ్‌సైట్ వివిధ ప్లాట్‌ఫామ్‌లకు, భాషలకు, దేశాలకు పనికివచ్చేవిధంగా (మళ్ళీ మళ్ళీ తయారుచేసే అవసరం లేకుండానే) యూనీకోడ్ సుసాధ్యం చేస్తుంది. అనేక సిస్టముల మధ్య రవాణాలో డేటా చెడిపోకుండా ఇది వీలు కల్పిస్తుంది.” (వీవెన్, యూనీకోడ్ డాట్ ఆర్గ్)

“ప్రపంచవ్యాప్తంగా సమాచార మార్పిడికి ప్రమాణ బద్ధమైన వ్యవస్థగా యూనికోడ్ ను ఆమోదించారు. భారతీయభాషల కోసం ఐ.ఎస్.ఐ.ఐ-88 లో అవసరమైన మార్పులు భారత ప్రభుత్వం యూనికోడ్ కన్సార్టియం సహాయంతో రూపుదిద్దడమే కాకుండా కేంద్ర ఇన్ఫర్మేషన్ టెక్నాలజీ శాఖ యూనికోడ్ కన్సార్టియం లో పూర్తికాలం ఓటింగ్ హక్కుతో కూడిన సభ్యత్వాన్ని పొందింది.” (వికాస్ పీడియా) 

“యూనీకోడ్ కన్సార్టియం” అంటే  “యూనీకోడ్ ప్రమాణపు అభివృద్ధి, వ్యాప్తి, విస్తృతికై ఏర్పాటైన లాభాపేక్షలేని సంస్థ”. ఈ ప్రమాణం ఆధునిక సాఫ్ట్‌వేర్ ఉత్పత్తులు, ప్రమాణాలలో వచన ఉపయోగ విధానాన్ని నిర్దేశిస్తుంది. కంప్యూటరు & సమాచార ఆధారిత పరిశ్రమకు చెందిన విభిన్న వ్యాపార, స్వచ్ఛంద సంస్థలు ఈ సంస్థలో సభ్యులుగా ఉన్నాయి. ఆర్థికపరంగా పూర్తిగా సభ్యత్వ రుసుము మీదే ఆధారపడి సంస్థ నడుస్తుంది. యూనీకోడ్ ప్రమాణాన్ని అమలుపరిచే మరియు దాని వ్యాప్తికి, అమలుకు తోడ్పడాలనుకునే అన్ని సంస్థలు మరియు వ్యక్తులు, ప్రపంచంలో ఎక్కడున్నా, యూనీకోడ్ కన్సార్టియంలో సభ్యత్వం పొందవచ్చు.” (యూనీకోడ్ డాట్ ఆర్గ్)

“అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతాలుగా రూపొందించడంలో యూనికోడ్ రూపొందించిన ప్రమాణం ప్రపంచవ్యాప్తంగా ఆమోదయోగ్యమైంది. టెక్స్ట్ ను కంప్యూటర్లో ప్రాసెస్ చేయడానికి  యూనికోడ్ ప్రమాణాన్ని ఉపయోగిస్తారు. ప్రపంచంలోని అన్ని లిఖిత భాషల అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతరూపంలోనిర్మించేందుకు కావలసిన సామర్థ్యాన్ని యూనికోడ్ ప్రమాణాలు అందజేస్తాయి. బహుభాషల టెక్ట్స్ కోసం వినియోగించే వారికే కాకుండా, కంప్యూటర్ వినియోగించే వ్యాపారవర్గాలు భాషావేత్తలు, పరిశోధకులు, శాస్త్రవేత్తలు, సాంకేతిక నిపుణులకు యూనికోడ్ ప్రమాణాలు ఎంతో ఉపయోగకరం.

యూనికోడ్ 16 విభాగాల సంకేత నిర్మాణ ప్రక్రియను ఉపయోగిస్తుంది. 65 వేలకు పైగా అక్షరాలకు చిహ్నాలకు, అంకెలకు  యూనికోడ్ సంకేత రూపం ( నోడ్ పాయింట్) కల్పిస్తుంది. యూనికోడ్ స్టాండర్డ్ , ఐ. ఎస్. ఓ -10646 స్టాండర్డ్ కలిసి యు. టి.ఎఫ్ -16 అనే అదనపు  వ్యవస్థను అందిస్తాయి. దాదాపు పదిలక్షల అక్షరాలు, చిహ్నాలు, అంకెలకు సంకేత రూపం (క్యారెక్టర్ ఎన్ కోడింగ్ ) కల్పిస్తుంది.” (వికాస్ పీడియా) 

“క్యారెక్టర్ ఎన్  కోడింగ్” అంటే అక్షరాలను కంప్యూటర్ కు బైట్ల రూపంలో  మార్చగలిగే నిర్దేశికత్వాల్ని తెలియజేస్తుంది.

ఒక విధంగా ఆలోచిస్తే  యూనీకోడ్ అనేది కంప్యూటర్  చరిత్రలో భాషలకు సంబంధించి ఒకానొక గొప్ప మైలురాయిగా  చెప్పదగిన విప్లవం. 

“తొలితరం తెలుగు సైట్లలో చాలా తక్కువ సైట్లు మాత్రమే తెలుగు లిపిని ఉపయోగించేవి. తెలుగు లిపిని వెబ్ పేజీలలో చూపించడానికి ప్రామాణికమైన పద్ధతి లేకపోవడం, తెలుగులిపిని బొమ్మల రూపంలో చూపే సైట్లు నడపడానికి కష్టం కావడంతో అవి తొందరగా మూతపడేవి. తెలుగు వంటి ఆంగ్లేతర భాషల/లిపుల కోసం ప్రత్యేకంగా సంకేత స్థలాలను కేటాయించే యూనికోడ్ ప్రమాణం (Unicode) 1991 నుండే అభివృద్ధి చెందినా, దానిని సమర్థించే (support) నిర్వహణా వ్యవస్థ (Operating System) లేకపోవడంతో 2003 వరకు యూనికోడ్ ప్రమాణాన్ని తెలుగు కోసం వాడుకోనే వీలు లేకపోయింది. కానీ, తెలుగు లిపిని కంప్యూటర్ తెరపై చూపడానికి, టైపు చెయ్యడానికి అవసరమైన వ్యవస్థను, వనరులను 2003లో Microsoft XP ఆపరేటింగ్ సిస్టమ్ లోనే పొందుపరచడంతో కంప్యూటర్లపై తెలుగు రాయడం, చదవడం ఎన్నడు లేనంతగా సుళువయ్యింది. తెలుగులో ఈమెయిళ్ళు రాసుకోవడానికి, తెలుగు లిపిని ఉపయోగించి వెబ్‌సైట్లను నిర్మించడానికి, తెలుగు చర్చావేదికలకు, ఇంటర్నెట్టులోనే వెతకగలిగే తెలుగు డిక్షనరీల నిర్మాణానికి యూనీకోడ్ సరికొత్త ద్వారాలను తెరిచింది. యూనికోడ్ టెక్నాలజీతో పాటు, Web 2.0 ఇంటరాక్టివ్ ఫీచర్లు అందరికీ అందుబాటులోకి రావడంతో, తెలుగు బ్లాగులు, కొత్త తరం తెలుగు పత్రికలు, తెలుగు వికీపీడియా వంటి బృహత్తర ప్రాజెక్టులకు మార్గం సుగమమయ్యింది.”  (సురేశ్ కొలిచాల, ఈ-మాట)

“కంప్యూటర్లలో తెలుగు భాష వాడకం మొదలైంది 1993 ప్రాంతంలో ముద్రణా రంగంలో వచ్చిన అనివార్య సాంకేతిక అభివృద్ధి వల్లే. డిటిపి అప్లికేషన్లు తయారవడం, వాటిల్లో వాడటానికి తెలుగు ఫాంట్లు రూపొందించడం, ఇలా తయారైన పేజీలను ముద్రించడానికి లేజర్ ప్రింటర్లు లాంటి అత్యాధునిక పరికరాలు రావడంతో డెస్క్‌టాప్ పబ్లిషింగ్ శరవేగంగా అభివృద్ధి సాధించింది. ఎప్పుడైతే ఇంటర్‌నెట్ రంగప్రవేశం జరిగిందో, అప్పటినుంచే ప్రాంతీయ భాషలను కూడా అంతర్జాలంలో ప్రవేశపెట్టే ప్రయత్నాలు మొదలయ్యాయి. అయితే ఫాంట్లను వెబ్ పేజీల్లోకి చొప్పించడం ప్రయాసతో కూడుకున్న వ్యవహారం కావడం, చదివేవారికి కూడా సాంకేతిక అవగాహన కావాల్సి రావడంతో అంతగా ఆ ప్రయత్నం విజయవంతం కాలేకపోయింది. యూనీకోడ్ ఫాంట్ల (ఏకసంకేత ఖతులు లేదా విశ్వరూప ఖతులు) ప్రవేశం అంతర్జాల భాషావినియోగాన్ని సమూలంగా మార్చివేసింది. ప్రపంచలోని లిపియుక్త భాషలన్నింటికీ అంతర్జాల ప్రవేశాన్ని కల్పించి, వాటి ఉనికిని కూడా కాపాడగలిగింది. ఇప్పుడు తెలుగు భాషలో మంచి యూనీకోడు ఫాంట్లు అభివృద్ధి చేశారు. అందమైన అక్షరాలు రకరకాల పరిమాణాల్లో రూపొందించారు వీటిలో చాలా వరకు ఉచితంగా లభిస్తాయి. తెలుగు భాష అక్షరాలకు ఈ క్రింది యూనీకోడు బ్లాకు ఇవ్వబడింది 0C00-0C7F (3072-3199).” (యూనీకోడ్ డాట్ ఆర్గ్)

యూనికోడ్ కంప్యూటర్ కు లిపి సంబంధిత కోడ్ నిర్దేశికత్వం వహిస్తే, ఫాంట్ అనేది లిపిని కనిపింపజేయడానికి ఉపకరిస్తుంది. వచ్చేనెలలో ఫాంట్ల గురించి తెలుసుకుందాం.

*****

Please follow and like us:

Leave a Reply

Your email address will not be published.