רכישת שפה ולמידת שפה אוטומטית

בעיתון "הארץ" התפרסמה אתמול ידיעה על צוות חוקרים מאוניברסיטת תל-אביב ומאוניברסיטת קורנל שפיתחו מערכת ממוחשבת המסוגלת ללמוד שפה טבעית ללא הדרכה וללא "דקדוק מולד", רק על סמך חשיפה לקורפוס של טכסטים. השאלה שמתעוררת היא האם דבר זה מערער את היסודות שעליהם מושתתת השערת המולדות המקובלת על-ידי חלק גדול מהבלשנים הגנרטיביים.

ראשית, קצת רקע: טענה ותיקה של חומסקי בדבר רכישת שפה היא שאם ילד נולד כ"לוח חלק", הקלט הלשוני שאליו נחשף ילד איננו מספיק לשם למידת כל חוקי השפה. טענה זו, הידועה בשם "דלות הגרוי" (poverty of the stimulus) מורכבת בעיקר משלושה מרכיבים:

  • הקלט הוא סופי ומצומצם, בעוד שדובר שפה מסוגל ליצור אינסוף משפטים, גם כאלה שמעולם לא שמע.
  • הקלט אינו מורכב רק ממשפטים שלמים ותקינים, אלא גם מקטעי משפטים, טעויות ביצוע, וכד'.
  • הילד לא מקבל עדות שלילית; כלומר, אף אחד לא מלמד את הילד באופן שיטתי אילו מבנים תחביריים הם בלתי אפשריים (פרט אולי למקרים ספציפיים שבהם ילד מייצר משפט בלתי תקין ומקבל תיקון לאותו משפט), ובכל זאת הילד יודע בסופו של דבר להבחין בין משפט תקין ומשפט בלתי תקין. לא ניתן לטעון שכל מה שהילד לא שמע אינו אפשרי, כי ישנם גם אינסוף משפטים תקינים שילד לא שומע.

על רקע זה, טען חומסקי עוד בשנות ה-50 שרכישת שפה חייבת להיות צירוף של ידע מולד עם חשיפה לקלט לשוני מהסביבה. במהלך השנים קיבלה השערת המולדות אישושים רבים ושונים, למשל, התגלו תבניות רבות החוזרות בכל השפות האנושיות, גם כאלה שאין ביניהן כל קשר היסטורי, דבר שהינו צפוי אם חלק מתכונות השפה נקבע מראש על-ידי היכולת הלשונית המולדת. כמו כן, תהליך רכישת השפה עובר דרך שלבים קבועים, בלי קשר לשפת הסביבה, דבר המאפיין יכולות מולדות מסוגים שונים. השערת המולדות, אם כן, אינה מתבססת באופן בלעדי על הטענה בדבר דלות הגרוי.

וכאן אנחנו מגיעים חזרה לנושא למידת השפה על-ידי המחשב. אם אכן קיימת תוכנה הלומדת שפה באופן אוטומטי לחלוטין, ומבלי שיהיו בתוכנה יכולות "מולדות" שמכוונות אותה לרכישת שפה אנושית דווקא, האם ניתן להסיק מזה משהו על רכישת שפה אצל ילדים?

התשובה המיידית היא "לא". לכל היותר, הטיעון בדבר דלות הגרוי מוחלש. אלא שניתן לבצע אותה משימה בדרכים שונות, ואין שום סיבה להניח שילדים רוכשים שפה באותו אופן שתוכנת מחשב מסוימת עושה זאת.

אלא שבמקרה זה, ישנו דבר חשוב יותר שחייבים לשים אליו לב: בניגוד לרושם המתקבל מקריאת הכתבה, התוכנה המדוברת לא הצליחה ללמוד שפה ברמה שדומה לרמה שבה ילד רוכש שפת אם. החוקרים בדקו את הצלחת התוכנה בכמה אופנים:

  • אחרי חשיפה לקלט של שיחות עם מוקד תמיכה בנושא טיסות (כלומר, שיחות שמוגבלות לתחום דיון ממוקד מאד, עם אוצר מילים קטן יחסית שחוזר שוב ושוב, ומספר מבנים תחביריים שחוזר בתדירות גבוהה), התוכנה נדרשה לייצר משפטים חדשים על סמך החוקיות שהיא למדה. בערך 70 אחוז מהמשפטים שהתוכנה יצרה היו משפטים תקינים.
  • אחרי חשיפה לקלט של דיבור טבעי בין הורים לילדים, התוכנה נדרשה לענות על שאלות שניתנות לתלמידי חטיבת ביניים בשוודיה אשר לומדים אנגלית כשפה זרה. השאלות היו מהסוג של השלמת מילה חסרה כדי ליצור משפט תקין, כאשר מוצגות 3 אפשרויות ויש צורך לבחור אחת מביניהן. במבחן זה, התוכנה השיגה בערך 60 אחוזי הצלחה. חשוב להדגיש שמדובר במבחן לתלמידים הלומדים שפה זרה, ולא במבחן הבודק שליטה בשפת אם.

ברור לחלוטין שהישגים אלה, גם אם הם מכובדים מאד יחסית להישגים של תוכנות מחשב אחרות המנסות לבצע משימות מסוג זה, הם רחוקים מאד מההישגים של ילד בן 3 המדבר בשפת אימו. לכן, כלל אין במקרה זה מקום לדיון בשאלה האם הופרך אחד הטיעונים בעד השערת המולדות, כי כלל לא הודגמה יכולת ללמוד שפה ברמה שמתקרבת ליכולת האנושית לרכוש שפת אם.

קישורים:

10 תגובות »

  1. יודי כתב(ה),

    דצמבר 29, 2005 @ 14:33

    חומסקי תקע את מחקר השפה באיוולתו הרבה, במיסטיקה לעניים שחיבר, האנטי מדעית ביסודה, בטעות הלוגית הבסיסית שיש בה.

    מה שהוא אמר זה משהו שדומה לדמגוגיה הדתית-פופוליסטית: איך נברא העולם? אלוהים ברא את העולם. תשובה שכמובן מותירה את השאלה על כנה: כן, אבל איך? נניח לצורך העניין שאלוהים ברא אותו: איך הוא עשה זאת? מה הטכניקה? איך זה נעשה בפועל?
    בדומה לכך, חומסקי אומר: איך המוח מפענח ויוצר שפה? יש לו "מנגנון מולד" לשם כך. (מנגנון מולד = אלוהים באנלוגיה הזו) כן, אבל איך? מה זה משנה אם המנגנון מולד או נוצר מאכילת סוכריות טופי בגיל שנתיים? איך המנגנון פועל? לפי חומסקי, זה מין פונקציית על בעלת כישורים כליים, מין אלוהים – קופסה שחורה שאין לדרוש אחריה דבר. רק אדם שהלוגיקה שלו לא חזקה במיוחד יכול ליפול בכשל הלוגי הבסיסי הזה. לרוע המזל רבים וטובים נפלו. אולי בגלל תשוקה למיסטיקה ולנשגב? מי ידע.
    נחזור לענייננו:
    למעשה, לגבי כל פונקציה שיש במוחנו אנחנו יכולים להסתפק בתשובה הזו: כיצד רואים? יש מנגנון מולד. כיצד שומעים? יש מנגנון מולד. וזה, לפי ההגיון של חומסקי, גם הגיוני: שהרי בכל פעם יש מראות חדשים, קולות ומוסיקה חדשים – לא יתכן שאנחנו יכולים לשמוע או לראות מה שלא שמענו עד כה. ומוצרט? איך יכול להיות שהוא חיבר מוסיקה שלא שמע קודם, ועוד בלי לזייף? והקהל שלו, בעיקר אלו שנולדו לפניו: איך יכלו לשמוע את המוסיקה שלו ללא מנגנון מולד ולדעת לשפוט שזו מוסיקה טובה וללא זיופים?

    אני מקווה שהנקודה הובהרה.

    בקיצור, הפילוסופיה דה לה שמאטה של חומסקי, תקעה את חקר ה"איך" של הבנת השפה להרבה שנים, בהסתפקה בטיעון דתי-פונדמנטליסטי של "מנגנון מולד", או "אלוהים ברא את העולם". חבל שלא למד פילוסופיה (אפלטון, אריסטו – זה כבר היה מספיק), ואם למד, לא הבין דבר. זהו האיש הבלתי מדעי ביותר שאני מכיר בעולם המדע.

    למזלנו, ישנם אנשים שעדיין נאמנים למדע ולציווי הראשון שלו: להסביר איך וכיצד. צח סולן והפרופסורים שמלווים אותו הראו שיתכן אלגוריתם שיכול לשחזר אינדוקטיבית את החוקים מן החומר המיוצר. ממש כפי שפועל המוח האנושי בכל תחום של ארגון מידע.

    אלגוריתם כזה היה למעלה מכוח השגתו ודמיונו של חומסקי. אבל כבר ברור מה דעתי על האינטלקט של חומסקי.

    ולחשוב שאדם קצר מחשבה ודמגוגי שכזה נחשב בקרב ההמון לאינטלקטואל המוביל בעולם…

  2. גבי כתב(ה),

    דצמבר 29, 2005 @ 18:17

    יודי, עקב הסגנון הבוטה של התגובה שלך, התלבטתי האם לפרסם אותה או לא; בסופו של דבר, מכיוון שהיא מדגימה מספר אי-הבנות נפוצות למדי הנוגעות לגישה הגנרטיבית, החלטתי לפרסם אותה יחד עם כמה הערות:

    הטענה שלך, שחומסקי הציג את היכולת הלשונית המולדת כ"קופסה שחורה שאין לדרוש אחריה דבר" ושהוא לא ניסה להסביר את ה"איך", היא טענה חסרת שחר בעליל. כל מי שהקדיש זמן לקריאת אחד מספריו ומאמריו הרבים של חומסקי בתחום התחביר יודע היטב שחומסקי הציע הסברים מפורטים ביותר לשאלת ה"איך". למשל, בכל אחד מהספרים הבאים הוא פיתח השערות מורכבות ביותר לגבי האופן שבו המערכת הלשונית נרכשת וכיצד היא פועלת:

    Chomsky, Noam. 1981. Lectures on Government and Binding. Dordrecht: Foris.

    Chomsky, Noam. 1986. Knowledge of Language. New York: Praeger.

    Chomsky, Noam. 1995. The Minimalist Program. Cambridge, Massachusetts: MIT Press.

    כמו כן, הטענה שלך שחומסקי "תקע את מחקר השפה" היא חסרת שחר; אתה מוזמן לעיין בכל אחד מכתבי העת שמפורטים כאן (ובעוד רבים אחרים) ולראות שפע של מחקרים על השפה, שחלקם הגדול מציעים גם הם תשובות לשאלות שלטענתך בלשנים "מיסטיים" אינם מנסים לספק להן תשובות.

    ולשאלת האלגוריתם של צח סולן: אני מסכים לחלוטין שההישג שלו הוא הישג מרשים. אלא שהמסקנות שהוסקו ממנו בדבר מנגנון השפה המולד הינן מוטעות, לדעתי. אם מתעמקים בפרטים, רואים שהאלגוריתם שלו מניח למעשה ידע לשוני מוקדם: ראשית, זהו אלגוריתם שתוכנן לרכישת דקדוקים של שפות (מסוגים שונים, אך בכל מקרה רק שפות, במובן המתמטי), ולא אלגוריתם למידה כללי שמצליח לרכוש סוגים אחרים של ידע שאינם בעלי מבנה של שפה. בפרט, זהו אלגוריתם שנועד לזהות שפות מסוג מסוים: שפות הניתנות לניתוח היררכי ע"י דקדוק חסר הקשר (context free grammar), שהוא אחד מסוגי המודלים הלשוניים שחומסקי עצמו הציג עוד בשנות ה-50. כפי שחומסקי הראה באותן שנים (דבר שכל סטודנט למדעי המחשב לומד), ניתן לחלק את כל השפות האפשריות למספר קטגוריות הנבדלות זו מזו ברמת המורכבות המתמטית שלהן – חלוקה הידועה בתור "ההיררכיה של חומסקי". אלגוריתם שמניח מראש שהשפה שהוא נחשף אליה היא שפה שניתן לתאר בעזרת דקדוק חסר הקשר הוא אלגוריתם שמניח מראש הנחה מהותית ביותר לגבי מבנה השפה; כלומר, זהו מעין "ידע מולד" שמניח האלגוריתם של צח סולן. מבחינת רוח הדברים, אם כן, אפשר להגיד שהאלגוריתם שלו אינו שונה באופן מהותי מהמודלים של חומסקי, שגם הם כוללים הנחות מופשטות וכלליות למדי לגבי סוג הדקדוק, שיחד עם חשיפה לקלט לשוני מובילות לדקדוק ספציפי ומלא. ההבדל בין שתי הגישות הוא יותר בפרטים: איזה הנחות בדיוק מניחה מערכת רכישת השפה? כדאי אולי לציין שכיום מעטים הם הבלשנים (כולל אלה שאינם חסידיו של חומסקי) שסבורים שניתן לתאר שפה טבעית, על כל מורכבויותיה, בעזרת דקדוק חסר הקשר; בעזרת דקדוק מסוג זה ניתן אולי לתאר אחוז גבוה ממשפטי השפה שנתקלים בהם בחיי היום-יום, אבל לא את כל המבנים האפשריים (ורק אותם).

  3. יהויכין כתב(ה),

    מאי 30, 2006 @ 18:43

    אבל קשה להתעלם מאספקטים רבים בתיאוריה החומסקיאנית שמונחים יש מאין – ההפרדה בין חלקי דיבר, לדוגמא, ההנחה כי פועל הוא פועל בכל הלשונות לא משנה איזה קטיגוריות הוא מראה ומה תפוצתו.
    עצם ההנחה של תנועה לשונית היא בעייתית, מאחר והיא מאפשרת לייחס, הלכה למעשה, כל מבנה למבנה אחר (למרות שקיימות מגבלות עליה) במיוחד שמתחילים לדבר על תנועה של אלמנטים ריקים – זה עניין שערוריתי מהבחינה המדעית, לעזאזל העובדות יחי מינימליזם!
    (בקיצור – האפריוריות של התיאוריה החומסקיאנית, שמניחה אוניברסליות של חלקי דיבר (פועל, שם – הנחה שאולי היא נכונה, אבל היא צריכה להיות נתונה להוכחה אמפירית שחלק ממנה צריך להיות הגדרה של פועל ושם עבור לשון נתונה וגו') לצד אוניברסליות של מבנים לשוניים ותנועה, ההנחה כי יש PRO עבור כל VP היא אנטי מדעית במקרה הטוב – איך ניתן להפריך זאת?

  4. גבי כתב(ה),

    מאי 31, 2006 @ 8:52

    האמת היא שאני לא ממש מבין איך מה שכתבת קשור לפה. הנושא שדנתי בו כאן הוא השערת המולדות, ואתה תוקף פרטים ספציפיים בתיאוריה התחבירית של חומסקי שאין להם קשר ישיר והכרחי לשאלת המולדות. אין שום קשר לוגי בין השניים: מבחינה לוגית, בהחלט ייתכן שהשערת המולדות נכונה, בעוד שכל המודל התחבירי של חומסקי שגוי; גם אם חומסקי עצמו מציע את המודל המינימליסטי כמימוש ספציפי של השערת המולדות, ייתכנו גם מימושים אחרים. לא כל הבלשנים הגנרטיביים מקבלים את המודל התחבירי של חומסקי; למשל, יש גישות תחביריות גנרטיביות שלא מניחות תנועה (וגם לא אלמנטים ריקים), ועדיין חלק גדול מהבלשנים שעובדים בגישות האלה מקבלים את השערת המולדות. לכן, מה שכתבת פה לא ממש רלוונטי לנושא הדיון.
    וכדאי אולי להוסיף שאני חושב שחלק מהביקורות שהעלית הן פשוט לא נכונות (למשל, יש לא מעט מאמרים, שנכתבו ע"י בלשנים גנרטיביים, שמפריכים טענות על קיום PRO בעמדה זו או אחרת). אם נושא הדיון כאן היה ביקורות כלפי התחביר המינימליסטי, הייתי מתייחס יותר בפירוט לביקורות שלך; ושלא יהיה ספק- אין לי כל עניין לשמש כסניגור של חומסקי, ובהקשר המתאים הייתי שמח להוסיף ביקורות משלי כלפי מרכיבים מסוימים במינימליזם. אבל בהקשר הנוכחי זה לדעתי פשוט לא שייך.

  5. ערן סיטי כתב(ה),

    ספטמבר 15, 2006 @ 14:13

    אשמח לקבל תשובה לשאלה,
    האם יש מחקרים המראים שהדיבור של האם במהלך ההריון, (דיבור שהעובר שומע) , מהווה מרכיב ברכישת שפת האם אצל העובר ?

  6. גבי כתב(ה),

    ספטמבר 17, 2006 @ 7:56

    ערן, אני באמת לא יודע מה התשובה לשאלה שלך, אבל אני חושב שיש השפעה למה שהתינוק שומע במהלך ההריון. למשל, המחקר הזה טוען שתינוקות בני יומיים כבר מגיבים אחרת לשפת אימם ולשפה אחרת. אני כמעט בטוח שיש עוד מחקרים מהסוג הזה, אבל אין לי הפניות למשהו ספציפי. בכל מקרה, קשה לתת תשובה חד משמעית לשאלות מהסוג הזה; לכל היותר אפשר למדוד פרמטרים מסוימים של התגובה של תינוקות שזה עתה נולדו, אבל אין ממש דרך לבודד את מה שהם שמעו במהלך ההריון ולדעת מה בדיוק זה תרם לרכישת השפה.

  7. יודי כתב(ה),

    יולי 2, 2007 @ 10:06

    גבי, אתה צודק בהחלט באשר לסגנון הבוטה שהפגנתי. אני מאמין שצריך מדי פעם "לנער את המערכת" באופן פרובוקטיבי ולטעון טענה קיצונית כדי לפתוח את אפיקי המחשבה ולעורר דיון (דגש על "לעורר" :-).
    בקשר לאלגוריתם של סולן (בינתיים פיתחו אלגוריתם משוכלל יותר), יתכן שדווקא, כדבריך, משום שהוא ספציפי לניתוח מבנים דקדוקיים, בזה חולשתו. יתכן שהוא אינו יורד מספיק עמוק כדי לחקות את "שפת המכונה" הבסיסית של המנגנון הלוגי האנושי.
    ככל שמנגנון הפענוח וצבירת המידע יהיה בסיסי יותר וכללי יותר, כך נתקרב להוכחה שאין "ידע מולד", ואין "אלגוריתם מובנה" ספציפי ללימוד שפה, אלא שילוב של יכולות כלליות, וביניהן היכולות הלוגיות הפשוטות שצוברות מקרים סטטיסטיים לכלל "כללים".
    הפונקציה הבסיסית ביותר, כך נדמה, היא ההשוואה וההבדלה (שתי פנים לאותה מטבע). האם ניתן לבנות על הבסיס הזה את האלגוריתם כולו? אם כן, ניתן יהיה ליצור מכשיר להבנה ולהטמעה של שפה, כמו של כל דבר אחר (אגב, כמו כל תקשורת אחרת עם העולם – לא מילולית, לא קולית אלא חזותית, וכו'. גם היכולת ללכת או שלא להיתקל בכסא יכולה להיכלל באופן הלימוד הזה, או כ"תקשורת" עם העולם הסובב אותנו).
    מה דעתך?

  8. גבי כתב(ה),

    יולי 2, 2007 @ 12:45

    יודי, אני מסכים איתך שאם ביום מן הימים מישהו יפתח אלגוריתם שבאמת לא מניח שום הנחות מוקדמות על מבנה השפה ועדיין מצליח לרכוש שפה באותה רמת דיוק כמו ילד שרוכש שפת אם, זה יוכיח שאין הכרח לוגי בידע מולד כתנאי לרכישת שפה (אבל מצד שני זה כמובן עוד לא יפסול את האפשרות שיש ידע כזה בכ"ז). אם זה יקרה או לא- אין לי מושג, אבל בהחלט יש מקום לבדוק את האפשרות הזאת ולראות כמה רחוק אפשר להגיע עם זה.

  9. **** כתב(ה),

    אוגוסט 27, 2007 @ 19:04

    אין לי שמץ של מושג בכל הנוגע לתורת המחשבים ולכן אולי פיספסתי משהו שהוא בסיסי. אבל-השאלה היא: האם אלגוריתם שמובנה בתוכנה הוא בעל ערך בינרי , כלומר –יכול לתת תשובה של כן/לא–מתפקד בעצם כמו עיקרון/פרמטר של חומסקיי? הרי "מישהו" צריך "לבנות" את התוכנה ולתת לה "כלים" לפני שהיא "לומדת" להשתמש בשפה. אם זה המצב,אזי ההצלחה/חוסר הצלחה של רכישת שפה על ידי תוכנה היא תוצאה של חלקיות הידע שלנו לגבי מכלול של עקרונות ופרמטרים (אנו בעלי ידע מוגבל לגבי כמות או אופי של פרמטרים (אולי הם לא בינריים))…אולי יש בידי טעות אבל במינימליזם–חומסקיי נוטה "לברוח" מבינריות….אולי חלמתי…. עומס ידע….

  10. זלמן כתב(ה),

    אפריל 12, 2010 @ 15:28

    יודי,
    קראתי ספר אמריקאי "גידול תינוקות עד גיל 5" או משהו בסגנון, שמחבריו המלומדים טוענים שתינוק בגיל X מפתח חיבה לצורות עגולות שבתוכן עוד צורות עגולות, מה שגורם לו לחייך אל הוריו.
    מאחורי לוגיקת הפיתוח של התיאוריה הזו, עומדת בעצם אותה הזוועה שתארת בתורתו של חומסקי.

RSS feed for comments on this post · TrackBack URI

הוספת תגובה