תרגום סימולטני באמצעות מחשב?

מישהו בפנטגון רואה כנראה יותר מדי סרטי מדע בדיוני. לפי דיווח של Associated Press שהתפרסם ביאהו, בוחן צבא ארה"ב שימוש בתוכנה לתרגום בזמן אמת של שפה מדוברת מאנגלית לערבית ולהיפך; ההערכה שמופיעה בכתבה צופה שהתוכנה תיכנס לשימוש לא לפני 2009 – הערכה אופטימית ונאיבית באופן תמוה, לדעתי. שווה להציץ בתגובות ב-slashdot לכתבה, שרובן תמימות דעים שמדובר בתוכנית בלתי מציאותית עד כדי גיחוך.

מדובר בשילוב של מספר בעיות, שכל אחת מהן כשלעצמה מהווה אתגר עצום לעוסקים בתחום הבלשנות החישובית ועיבוד השפה הממוחשב; בפרט, זיהוי דיבור ותרגום ממוחשב הם שתי משימות מורכבות מאין כמוהן, שכל התוכנות הקיימות כיום בשוק משיגות בהן לכל היותר ביצועים מתקבלים על הדעת. מערכות לזיהוי דיבור מצליחות, לאחר תקופת "אימון" שבו הן לומדות את מאפייני הדיבור של דובר ספציפי, להגיע לאחוזי דיוק גבוהים למדי עבור אותו דובר בתנאים "סטריליים" (דיבור ברור, ישירות למיקרופון איכותי, וללא רעשי רקע); ללא אימון מוקדם ובתנאים שכוללים רעשי רקע ודיבור טבעי, אחוז הטעויות הוא גבוה למדי. תוכנות לתרגום אוטומטי מצליחות גם הן, לכל היותר, ליצור תרגומים שאפשר במאמץ מסוים להבין (הנה למשל עמוד הפתיחה של אתר האינטרנט של אל-ג'זירה, מתורגם לאנגלית על-ידי תוכנת התרגום של גוגל, שהיא אחת הטובות ביותר הקיימות כיום). התוכנה של IBM שאותה בוחן צבא ארה"ב מציבה לעצמה יעדים הרבה יותר יומרניים: היא שואפת לתרגם דיבור (ולא טקסט כתוב) בזמן אמת, בתנאי שטח וללא אימון מוקדם. מדובר בפרויקט שהוגדר ע"י IBM כפרויקט מחקר "הרפתקני", ואין ספק שאנשי IBM מודעים לקשיים העצומים שמעורבים במשימה מסוג זה.

באתר של הפרויקט ניתן למצוא בין השאר קישור לקטע וידיאו קצר שמדגים את השימוש בתוכנה לתרגום סימולטני של שיחה בין דובר אנגלית לדוברת סינית. השיחה מוגבלת למשפטים פשוטים למדי, ורחוקה מלהדגים שימוש טבעי ויומיומי בשפה. גם תרגום שיחה פשוטה מסוג זה מהווה הישג מרשים, לאור אינספור המרכיבים הכרוכים בזיהוי שפה מדוברת ומציאת תרגום שעומד במגבלות התחביר, הסמנטיקה, וההתאמה להקשר. קשה שלא להיות סקפטיים לגבי סיכויי ההצלחה של תוכנה מסוג זה בתסריטים כמו זה שנרמז בכתבה, לניהול שיחות בין חיילים אמריקאיים לתושבי מדינות כמו עירק: קבוצות של חיילים אמריקאים חמושים בלפטופ, המנסים לתקשר עם תושבים עירקים באמצעות מיקרופון ומחשב שמדבר ערבית משובשת ולא תמיד מתרגם נכון – זה לא נשמע כמו מתכון להצלחה. קשה שלא להזכר במערכון של מונטי פייתון על השיחון ההונגרי-אנגלי (או בכתב, למי שמתקשה במשימה של פענוח שפה מדוברת), ולצפות שהתוצאות יהיו שונות בהרבה. במקרה הטוב, יסתיים המפגש בין האמריקאים לעירקים בכך שכל הצדדים שוכבים על הארץ כשהם מתגלגלים מצחוק.

ואפרופו השפה הערבית והפנטגון, הפוסט הזה בנושא שליטה בשפה הערבית (או העדרה) בקרב אנשי ה-FBI (שמתבסס על דיווח ב-Washington Post) נראה הזוי מכדי להיות אמיתי; בהחלט שווה קריאה, גם אם אין כאן הרבה מנקודת מבט בלשנית.

2 תגובות »

  1. ריימונד כתב(ה),

    יוני 5, 2007 @ 20:27

    שלום גבי,

    ברכות הבלוג שלך.
    שתי שאלות:
    – האם יש אתר אינטרנט או תוכנה למק המתרגמת טקסטים שלמים מעברית לאנגלית.
    – האם אתה מכיר התרגום לעברית של המילה האנגלית Demutualization כוונה היא למצב שבו קואופרטיב מפסיק להיות כזה ונהפך בין היתר לחברת מניות. ראה מקרה תנובה בזמן האחרון.

    בתודה מראש

  2. גבי כתב(ה),

    יוני 6, 2007 @ 8:41

    ריימונד- אני חושש שהתשובה שלי לשתי השאלות שלך היא "לא". אני לא מכיר שום כלי רציני לתרגום עברית-אנגלית (אם מישהו כן מכיר, בבקשה ספרו לי); וזו הפעם הראשונה שאני נתקל במילה שציינת (ובכל מקרה, בכל הנוגע לתרגום מילים, הידע שלי כבלשן לא שונה מהידע של כל אדם ששולט בשתי השפות; ידע בבלשנות לא ממש מועיל הרבה מהבחינה הזו).

RSS feed for comments on this post · TrackBack URI

הוספת תגובה