יחידת הניתוח הלשוני
יחידת הניתוח הלשוני מקבלת כקלט טקסט עברי לא מנוקד והופך אותו לרשימת פונמות. תהליך ההסבה לפונמות נעשה במסלול הבא:
- עבור כל מילה אפשרית נעשית פרישה של אפשרויות הקריאה השונות (למשל שַבְתָה, שֶבַּתֵּה, שָבָּתָהּ, שֶבִּתָה, שִבְתָהּ, שֹבְתָהּ וכו')
- הפעלתם של חוקים דקדוקיים מאפשרת פסילה של חלק מאפשרויות הקריאה (למשל במקרה של קלט 'האיש החזק' נפסלת הקריאה 'הָאִיש הָחֹזֶק' מכיוון שאינה חוקית – אין שרשור של שני שמות עצם מיודעים.
- על מטריצת הקריאות יש להריץ עתה תהליך סטטיסטי המשתמש במודל HMM (ראשי תבות של Hidden Markov Model). התהליך "לומד" את ההסתברויות של הופעת מילים בשרשור מתוך קורפוס מתוייג מראש, ובוחר את הקריאה הסבירה ביותר לפי חוקים אלו.
- במצב העניינים הנוכחי אהרון עדיין משתמש ביחידות הניתוח ובניית הפרוזודיה של תוכנה ותיקה הנקראת סתיו. תוכנה זו אינה משתמשת במודל סטטיסטי או בסמנטיקה אך מגיעה לאחוזי הבנה סבירים בהחלט.
בימים אלה אנו שוקדים על פיתוחה של יחידת ניתוח חדשה שצפויה להגיע לאחוזים הגבוהים ביותר האפשריים. פיתוחה של יחידת הפרוזודיה החדשה מתוכנן גם הוא לחודשים הקרובים.
יחידת יצירת הפרוזודיה
יחידת יצירת הפרוזודיה מוסיפה נתוני טעם וניגון לרשימת הפונמות, ומוציאה פלט בצורה של רשימת נתונים פרוזודיים: פונמה, אורך הצליל, גובה הצליל ועוצמת הצליל.
לצורך השמת הטעם משתמש התהליך בלקסיקון מוכן של תעתיקי מילים, אך מוסיף עליהם גם מספר חוקי טעם דינאמיים (למשל, נדידת הטעם להברה האחרונה בריבוי)
לצורך בנית הניגון מתחשב התהליך בפרמטרים שונים הנוגעים לאורך המשפט, אופיו (שאלה, הדגשה וכו') ונקודות ההדגש שבו.
יחידת ההסבה לקול
- יחידת ההסבה לקול מקבלת כקלט את רשימת הנתונים הפרוזודיים והופכת אותם לקובץ אודיו בפורמט הרצוי:
- תהליך ההסבה משתמש בבסיס נתונים ענקי המכיל הקלטות של השפה העברית על ידי קריין אחד, בתנאי הקלטה אופטימליים. בסיס הנתונים מתוייג בצורה המאפשרת שליפה מהירה של קטעי קול בכל מקטע אפשרי.
- התהליך עובד בשיטה הנקראת "צימוד" (קונקטנציה): הוא מחפש בבסיס ההקלטות את הקטע הארוך ביותר הזהה לדרישות הפרוזודיה. הדרישה המינימלית תהיה בדרך כלל טריפון, דהיינו צרוף של שלוש פונמות זו אחר זו. את הקטעים השונים הוא "מצמד" זה לזה בצורה חלקה ככל האפשר.
- ככל שהחומר בבסיס הנתונים עשיר ומגוון יותר, כך תעלה איכותו של קובץ הפלט. בסיס הנתונים העכשווי של אהרון מכיל כמות רבה של חומר מוקלט ומתוייג, ובגרסא הבאה תגדל הכמות פי שתיים.
יחידת הבקרה
יחידת הבקרה מאפשרת למשתמש בקרה על אופציות שונות בהסבת הטקסט לקול:
- טיפול בסימני פיסוק – המנוע יכול להתעלם, לעצור קמעה, להגיד את סימן בפיסוק או להגיד רק "מרכאות" ו"ראשי תבות".
- מהירות וגובה הצליל
- סגנון הדיבור: המשתמש מוזמן לבחור בין סגנון דבור רשמי (המבטא ח ו-ע) , רגיל (דומה לרשמי, אך ללא האותיות הגרוניות) או לא-רשמי (דומה לדרך בה מתבטאים בשיחות)
- תמיכה בארועי סוף מילה: כאשר המנוע מדווח על אירועי סוף מילה יכולה התוכנה המשתמשת בו לסמן את המילה המבוטאת בצורה מקוונת.
- תמיכה באירועי VISMES – כאשר המנוע מדווח על אירועים אלו יכולה התוכנה המשתמשת בו ליצר יצוג גראפי של הדיבור.
- שליטה במילון האישי, המאפשר לכפות הגדרת מילים ומבטאם.
תמיכה בסטנדרטים
- מנוע אהרון תומך במערכות הפעלה Vista , Windows XP ו Windows7.
המנוע תומך במערכות Windows Server 2003 ו Windows Server 2008. - המנוע תומך בסטנדארט SAPI של Microsoft, החל מגרסא 5.1. מחוייבותנו לתמיכה בסטנדרט היא מלאה ואנו תומכים בכל הארועים שלו.
- המנוע תומך באופן מלא בפרוטוקול MRCP 1.0
- המנוע מסוגל ליצא קול כקובץ WAV, באיכות 8Bit\8Khz עד 16Bit/48Khz. המנוע תומך גם ביצוא בפורמטים a-Law ו u-Law
מעטפת סתיו
מעטפת זו הינה חלק בלתי נפרד מהתקנת אהרון, ומאפשרת הקראה של שפות זרות על ידי מנועי דיבור אחרים המותקנים על המחשב של המשתמש.
המעטפת מסוגלת לזהות אוטומטית טקסט בערבית, רוסית או אנגלית, ולהפנותו למנוע הדיבור הנכון באופן מקוון. המשתמש יכול לבחור איזה מנוע יבטא כל שפה.