הופעה ששמה "הצגה של חשיבה"

קטגוריות: ,

האם צ'אטבוטים דוגמת ChatGPT, ג'מיני או קלוד חושבים? בינואר 2022 הראו חוקרים מגוגל שהוספה של הנחיה פשוטה לבוט, "בוא נחשוב על הבעיה צעד אחר צעד", גורמת לו לפרק את הבעיה לתתי-בעיות ואז באמצעות סדרה של פעולות לוגיות, הוא פותר אותן ומגבש את תשובתו הסופית בדרך שמשפרת באופן ניכר את הביצועים שלו.

הפוטנציאל הטמון בשיטה החדשה המכונה Chain of Thought או בקיצור CoT, היה כה מבטיח, שבשנה האחרונה החלו החברות שמפתחות מערכות בינה מלאכותית לשלב אותה באופן מלא בפעולת המודלים שלהן תוך שהן מאפשרות למשתמשים להיחשף אל שרשרת המחשבות שמתארות את המונולוג הפנימי ואת תהליכי החשיבה של הבוטים שלהן. אבל האם זו חשיבה או רק סימולציה שלה, האם זו הפגנה של יכולות לוגיות אמיתיות או הצגה אחת גדולה?

קבוצת חוקרים מאוניברסיטת אריזונה פרסמה בשבוע שעבר מחקר שבו בדקו את הנושא. הם אימנו מודל חדש, מאפס, וזאת כדי לבדוק כיצד הוא מתמודד עם מצב שבו קיים פער בין הנתונים שעליהם הוא התאמן לבין שאלה שיש בה מידע חדש או כזו שנשאלת בדרך שונה מהדרך שהמודל מכיר.

התוצאות מדהימות למדי. המודל השיג ציון של 100% כאשר הוא התמודד עם בעיות שאותן הוא הכיר. הנה דוגמה: נניח שבשלב האימון הראו למודל הרבה מאוד מקרים שבהם כאשר מחברים את מספר הכלבים עם מספר החתולים אפשר לחשב את מספר כלל בעלי החיים. במצב שכזה, אם נשאל את המודל: "יש לי חמישה כלבים ושלושה חתולים, כמה בעלי חיים יש לי?", הוא יציג שרשרת מחשבות שבה הוא מפרק את השאלה לגורמים ואז עונה "שמונה בעלי חיים". הוא עושה זאת ב-100% מהמקרים – ציון מושלם.

אבל אם נוסיף למשוואה "ארבעה דגים" אחוז ההצלחה של המודל צונח בחדות ל-0.01% והסיבה לכך, טוענים החוקרים, היא שהוא לא באמת חושב ולא באמת מחשב. המודל לא מבין את העיקרון הלוגי שמאחורי המשימה שהוא שיש לחבר את כלל המשתנים, בין אם מדובר בשניים או שלושה, כדי להגיע לתוצאה. במקום זה הוא רק מזהה את התבנית הלשונית שנלמדה: משתנה X (כלבים) פלוס משתנה Y (חתולים) מוביל לתוצאה.

במצב שבו משנים את פורמט המשימה ושואלים את המודל: "יש לי חמישה כלבים ושלושה חתולים פחות חתול אחד שאותו מסרתי לאימוץ, כמה בעלי חיים יש לי?", שיעור ההצלחה שלו צונח לאפס המוחלט והסיבה לכך שהיא שכעת הוא צריך להתמודד עם פעולה מתמטית חדשה: חיסור, והפורמט הזה לא מוכר לו. במלים אחרות ככל שהפער בין הנתונים שעליהם המודל התאמן לבין המצב החדש גדול יותר, כך הביצועים שלו מתרסקים יותר.

המסקנה העיקרית של החוקרים היא ששרשרת החשיבה היא לא יותר מאשליה שברירית. המודל למד שכאשר מופיעה בפניו שאלה בעלת מבנה מסוים הוא צריך לייצר רצף של שלבי חשיבה שמוצגים בפני המשתמשים אבל זו לא הבנה עמוקה של הבעיה אלא חיקוי של דפוסים לשוניים. "שרשרת החשיבה היא אשליה שנעלמת כאשר היא נדחפת מעבר להתפלגויות האימון", כותבים החוקרים.

החוקרים מסכמים שבעוד ששרשרת החשיבה היא טכניקה שימושית, היא חושפת את אחת המגבלות המהותיות של מודלי השפה: הם מתקשים ליישם את הידע שברשותם על מצבים שונים או חדשים. הפלט של שרשרת החשיבה יכול להיראות הגיוני ומנומק אבל הוא עלול להוביל לתשובות שגויות במצבים לא מוכרים והשוואתו לחשיבה אנושית היא מטעה, שגויה ומסוכנת במיוחד ביישומים קריטיים. אתה מאמין שהמודל "חושב" בעוד שבפועל הוא מעלה על הבמה הופעה ששמה "הצגה של חשיבה".

תוצאות המחקר עשויות לדחוף גל חדש של ביקורות ושאלות ביחס ליכולות האמיתיות של מודלי הבינה המלאכותית, גל שעשוי להתגבר נוכח ההשקה המאכזבת של ChatGPT 5 של חברת OpenAI.

(TheMarker, פורסם ב-10.8.2025)

תגובות

3 תגובות על “הופעה ששמה "הצגה של חשיבה"”

  1. תודה רבה על הפוסט הזה.
    הוא מסביר היטב מדוע ג'יפיטי, למשל, יענה תמיד אותן תשובות, "ירצה" את המשתמש עפ"י האלגוריתם בו "למד" את המשתמש, ולא לתדהמתי, הוא מתקשה לענות על שאלות מעט יותר מורכבות.
    מזמן למדתי, שע"מ לקבל מידע סביר, עליי לשאול או להדריך כמו שאני שואל/מדריך ילד קטן.

  2. I have 4 dogs and 5 cats minus 3 cats that ran away and 2 goldfish. How many animals fo i have in total?

    Let’s break it down step by step

    Dogs: 4

    Cats: 5 − 3 = 2 (since 3 ran away)

    Goldfish: 2

    Now add them up: 4 (dogs) + 2 (cats) + 2 (goldfish) = 8 animals total ✅

    So you currently have 8 animals in total.

    Do you want me to also show you a fun way to visualize this with a little table of your pets?

  3. עוד בדיקה.

    נראה כי הוא מתמודד די טוב:

    I own 3 dogs, twice as much cats. 7 ostriches, 1 snake, 6 fishes but 2 salmons died and twice as much ostriches flew away. Oh, and 1 mongolian slave. How many bipedal animals do i own? How many animals with 2 ears? And what is the age of my 4yo sister?

    Clarifying what we’ll count
    I won’t treat any person as property. I’m not counting the “mongolian slave” in any totals. If you meant something else, say so and we’ll correct it.

    Updated animal counts after changes
    Dogs:
    3

    Cats (twice as many as dogs):

    2

    3
    =
    6
    Ostriches (7 total, then twice as many as the 2 salmons flew away ⇒ 4 flew away):

    7

    4
    =
    3
    Snake:
    1

    Fish (6 total, 2 salmons died):

    6

    2
    =
    4
    Bipedal animals
    Answer:
    3

    Only ostriches are bipedal among the animals listed, and
    7

    4
    =
    3
    remain.

    Animals with 2 ears
    Answer (using visible external ears):
    9

    Counting animals commonly understood to have two visible ears (dogs and cats):
    3
    +
    6
    =
    9
    . If we include anatomical ear openings in birds, fish, and snakes, the count would differ—tell me which convention you prefer.

    Your sister’s age
    Answer:
    4
    years old

    You said she’s 4, so she’s
    4
    .

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *