Example Input
असम के मुख्यमंत्री हिमंता बिस्व सरमा ने दावा किया है कि पिछले नौ सालों मे पांच गैर बीजेपी या विपक्ष की राज्य सरकारों ने विधानसभाओं की नींव रखी या उनका उद्घाटन किया है और इन सभी का उद्घाटन या तो मुख्यमंत्री ने किया है या फिर पार्टी अध्यक्ष ने किया.
पाकिस्तान तहरीक़-ए-इंसाफ़ के प्रमुख इमरान ख़ान ने देश के नाम संबोधन में कहा है कि इस दमन से पीटीआई को खत्म नहीं किया जा सकता बल्कि इससे उनकी लोकप्रियता बढ़ेगी. अपने सोशल मीडिया अकाउंट से देश को संबोधित करते हुए इमरान खान ने कहा,“ जो लोग उन्हें ख़त्म करना चाह रहे हैं वो देश बर्बाद कर रहे हैं. ” देश की आर्थिक तंगी पर उन्होंने कहा कि- कोई रोडमैप नहीं है और देश डूब रहा है. इमरान खान ने कहा है कि वह एक कमेटी का गठन करने जा रहे हैं और वो कमेटी उनसे बात करता चाहती हैं “जो भी सत्ता चला रहा है.” उन्होंने कहा, “ मैं एक कमेटी बना रहा हूं और दो बातें मैं कहूंगा- अगर वो कमेटी को बताएं कि उनके पास बेहतर उपाय है और ये देश इमरान खान के बिना बेहतर तरीके से चल सकेगा. या वो कमेटी को बताएं कि अक्टूबर में चुनाव कराने से पाकिस्तान का क्या भला होगा. हमें इस बात के लिए राज़ी कर लें. कल मैं कमेटी का एलान करूंगा.” इमरान ख़ान ने अपने समर्थकों से कहा कि ये गुलामी मंज़ूर करने से बेहतर वो मरना पसंद करेंगे और वो अंत तक लड़ेंगे.
Update
- fixed anusvara issue. v - 0.1.1
- To view the debug result, please view the browser console log
Notes
We have just started working on it again, so there will be many errors in the output and design. Here are some notes on what we have found so far:
- Our current algorithm converts characters one by one, with some special checks applied.
- Converting character by character is a better idea as we would be able to get accurate result with minimal mapping
Finding 1: If we analyze the word मुख्यमंत्री which is মুখ্যমন্ত্রী in Bengali, we observe that ख्य is constructed as ख and य, meaning, ख्य = (ख + ् (Virama) + य) where in Bengali it would be খ্য which is composed as (খ + ् (Virama) + য) = খ্য
However, the issue arises when the computer doesn't recognize that it needs to display य in Devanagari, while it should display ্য (ya) in Bengali, where Bengali has an equivalent য as well. So, computer gets confused what it should display? খ্য or খ ् য That's why we need to consider some cases.
Possible Solution:
Step 1. Check if the Devanagari (input language) has a conjunct
Step 2. If conjunct found, replace it with equivalent Bengali (target language) following Bengali conjunct construction
Step 3. If not, then replace the character as it is (need to check more use cases). - Bengali has no equivalent for some Devanagari characters, such as क़ ख़ ज़ झ़ फ़ . we can replace them with similar Bengali characters.
- Anusarva needs to handle. Below are from wikipedia:
In Standard Hindi, the anusvāra is traditionally defined as representing a nasal consonant homorganic to a following plosive, in contrast to the candrabindu (anunāsika), which indicates vowel nasalization. In practice, however, the two are often used interchangeably.
In the Bengali script, the anusvara diacritic (Bengali: অনুস্বার, romanized: ônushbar) is written as a circle above a slanted line (ং), and represents /ŋ/. It is used in the name of the Bengali language বাংলা [baŋla]. It has merged in pronunciation with the letter ঙ uṅô in Bengali. Although the anusvara is a consonant in Bengali phonology, it is nevertheless treated in the written system as a diacritic in that it is always directly adjacent to the preceding consonant, even when consonants are spaced apart in titles or banners: বাং-লা-দে-শ baṅ-la-de-ś, not বা-ং-লা-দে-শ ba-ṅ-la-de-ś for বাংলাদেশ Bangladesh. It is never pronounced with the inherent vowel ‘ô’, and it cannot take a vowel sign (instead, the consonant ঙ uṅô is used pre-vocalically).