אתגרים בבנית מנוע דיבור עברי - המשך

מעבר לבעית הכתב קיימים בלשון העברית נושאים רבים אחרים המקשים על קריאה אוטומטית מדוייקת :

  • עושר מורפולוגי אדיר: שַבְתָה, שֶבַּתֵּה, שָבָּתָהּ, שֶבִּתָה, שִבְתָהּ, שֹבְתָהּ נכתבים בצורה זהה, אך משמעות ה'ש' , ה-'ב' וה-'ה' משתנה ממילה למילה

  • טעם משתנה: למשל בדוגמא - בַּנוּ (בתוכנו) ו-בָּנוּ (בנו את הבניין) - מבוטאות בצורה זהה מלבד הטעם, המשנה לחלוטין את משמעות המילה

  • גמישות יתר תחבירית: ביתי הוא גדול, גדול הוא ביתי, ביתי גדול הוא - כולם ביטויים חוקיים ומקובלים

תכונות אלה הופכות את הבנת השפה לתלוית-קונטקסט ברמה קיצונית, מעל ומעבר לכל שפה אחרת, ולפיכך לקשה מאוד לניתוח אוטומטי. פיתוח של מנוע אנליטי עבור עברית הוא תהליך ארוך, קשה ומסובך, ומצריך ידע רב בתחומים רבים.

הפוטנציאל של מנוע דיבור בעברית הוא אדיר, ובניית יישומים ופיתוחים המשתמשים בו הוא תהליך שנמצא בראשית דרכו. עם זאת, מעט חברות מסוגלות לרכז את הידע והניסיון הדרושים לפיתוחו של מוצר מסוג זה. השילוב המוצלח של בלשנים, תיאורתיקנים בתחום עיבוד אותות, מהנדסי קול ומפתחי תוכנה מוכשרים מהתעשיה והאקדמיה מאפשר ל"אהרון טכנולוגיות קול" להיות בחזית הפיתוח והחדשנות, ולהפוך את מנוע הדיבור אהרון למנוע הדיבור המוביל לשפה העברית.

אנו החלטנו להרים את הכפפה!

aharon
אודות היזמים דף הבית
All rights reserved @ www.aharontts.co.il צרו קשר