עברית היא השפה המדוברת ביותר בישראל. זוהי שפת התנ"ך ושפת החכמים אך זוהי גם שפה השגורה בפיהם של כ-9 מיליון איש ברחבי העולם, אוכלוסיה שרובה הגדול מכיר ושולט היטב במושגי המחשב.

בעידן בו מחשבים משתלטים על עוד ועוד משימות בשרותם של המשתמשים, היכולת לדבר אמורה להיות דרישה מובנת מאליה מכל ציוד ממוחשב. ואכן, יישומים הנעזרים במנועי דיבור מקבלים תשומת לב גוברת והולכת מצד מפתחים וצרכנים. מנועי דיבור קיימים היום כמעט בכל שפה ראשית בעולם, אך גם שפות "קטנות" ודיאלקטים מתהדרים במנועי דיבור משלהם. לפיכך, מפתיע מאוד לגלות שבישראל, הנחשבת מובילה בעולם בתחומי היי-טק וטכנולוגיות ממוחשבות, חסרה תשתית בסיסית כל כך.

הסיבה לאנומליה זאת מקורה בעובדה שעברית היא כנראה השפה הקשה והמסובכת ביותר לניתוח לשוני, כזה הדרוש להפיכת טקסט לקול. הקושי הראשון והבולט ביותר מצוי בדרך שבה נכתבת השפה:

שימוש בכתב ללא תנועות: כָּתַב, כְּתַב, כִּתֵב, כֻּתַב ו כְּתֹב נכתבים בצורה זהה, אך מבוטאים אחרת.

סובלנות קיצונית באיות מילים: ניקוד מלא וחסר ואותיות המבוטאות בצורה זהה יצרו מצב זה: למשל המילה "פלשתיני" יכולה להכתב בשמונה דרכים שונות – פלסטיני, פלשתיני, פלסתיני, פלשטיני, פלסטינאי, פלשתינאי, פלסתינאי או פלשטינאי.

ניקוד מלא וניקוד חסר משמשים בערבוביה ובגמישות רבה. את המילה "לויתן" ניתן לכתוב ב 8 דרכים שונות: 'לויתן' 'לוייתן' 'לווייתן' ,לוויתן, 'ליוויתן', 'ליוייתן' או 'ליווייתן'

תכונות אלה יוצרות מצבים שכיחים בהם למילה מסויימת יש מעל 15 קריאות שונות!

מעבר לבעית הכתב קיימים בלשון העברית נושאים רבים אחרים המקשים על קריאה אוטומטית מדוייקת :

תכונות אלה הופכות את הבנת השפה לתלוית-קונטקסט ברמה קיצונית, מעל ומעבר לכל שפה אחרת, ולפיכך לקשה מאוד לניתוח אוטומטי. פיתוח של מנוע אנליטי עבור עברית הוא תהליך ארוך, קשה ומסובך, ומצריך ידע רב בתחומים רבים.

הפוטנציאל של מנוע דיבור בעברית הוא אדיר, ובניית יישומים ופיתוחים המשתמשים בו הוא תהליך שנמצא בראשית דרכו. עם זאת, מעט חברות מסוגלות לרכז את הידע והניסיון הדרושים לפיתוחו של מוצר מסוג זה. השילוב המוצלח של בלשנים, תיאורתיקנים בתחום עיבוד אותות, מהנדסי קול ומפתחי תוכנה מוכשרים מהתעשיה והאקדמיה מאפשר ל"אהרון טכנולוגיות קול" להיות בחזית הפיתוח והחדשנות, ולהפוך את מנוע הדיבור אהרון למנוע הדיבור המוביל לשפה העברית.

אנו החלטנו להרים את הכפפה!

נשמח
לשמוע מכם!