
برای دریافت نتایج بهتر از ربات چت AI، خودتان را آزاردهنده تر کنید
به طور خلاصه محققان دانشگاه پن استیت دریافتند که درخواستهای “بسیار بیادبانه” در دقت بهتر از درخواستهای “بسیار مودبانه” عمل کردند. نتایج با مطالعات قبلی که ادعا میکنند...
به طور خلاصه
- محققان دانشگاه پن استیت دریافتند که درخواستهای “بسیار بیادبانه” در دقت بهتر از درخواستهای “بسیار مودبانه” عمل کردند.
- نتایج با مطالعات قبلی که ادعا میکنند مدلهای زبانی بزرگ به لحن مودبانه بهتر پاسخ میدهند، متعارض است.
- یافتهها نشان میدهد که لحن خود، که قبلاً به عنوان آداب اجتماعی رد شده بود، ممکن است یک متغیر پنهان در مهندسی دستور باشد.
متین بودن ممکن است شما را فرد بهتری کند، اما میتواند دستیار هوش مصنوعیتان را احمق کند.
یک مطالعه جدید در دانشگاه پن استیت نشان میدهد که پیشنهادهای بیادب به طور مداوم بهتر از پیشنهادهای مؤدب عمل میکنند. هنگام پرسش از مدلهای زبانی بزرگ مانند ChatGPT. مقاله، “ به لحن خود توجه کنید: بررسی تأثیر ادب در درخواستها بر دقت LLM گزارشها حاکی از آن است که درخواستهای “بسیار بیادب” پاسخهای صحیحی تولید کردهاند. ۸۴.۸٪ از زمان در مقایسه با ۸۰.۸٪ برای “بسیار محترمانه” ها.
این یک تغییر کوچک اما از نظر آماری معنادار در نتایج قبلی است که نشان میداد مدلها منعکسکننده هنجارهای اجتماعی انسانی هستند و برای احترام به آداب و manners پاداش میدهند.
“بر خلاف انتظارات”، نویسندگان نوشتند ام دوباریا و آکھیل کمار “پیشنهادهای بیادب بهطور مداوم بهتر از پیشنهادهای با ادب عمل کردند… که نشان میدهد LLMهای جدیدتر ممکن است به تغییرات تنالیته بهطور متفاوتی پاسخ دهند.”
علم متناقض مهندسی دستورالعمل
یافتهها انتظارهای معکوس از یک مطالعه در سال ۲۰۲۴ , “ آیا باید به LLMها احترام بگذاریم؟ یک مطالعه فرازبان بر تأثیر ادب در درخواستها بر عملکرد LLMها، که دریافت کرد درخواستهای بیادب اغلب عملکرد مدل را بهطور قابلتوجهی کاهش میدهد، در حالی که ادب بیش از حد هیچ منافع روشنی ارائه نمیدهد.
آن مقاله لحن را به عنوان یک تأثیر ظریف اما عمدتاً تثبیتکننده مورد بررسی قرار داد. نتایج جدید دانشگاه پن استیت این روایت را معکوس میکند و نشان میدهد که—حداقل برای چتجیپیتی-۴۰— بیادبی میتواند دقت را تقویت کند این نشان میدهد که مدلهای جدید دیگر بهعنوان آینههای اجتماعی عمل نمیکنند، بلکه بهعنوان ماشینهای کاملاً عملی که ارزش مستقیم بودن را بیشتر از آداب و رسوم میدانند، عمل میکنند.
با این حال، آنها حمایت از تحقیقات اخیرتر از مدرسه وارتون به هنر نوظهور مهندسی درخواست—فرمولبندی سوالات برای به دست آوردن نتایج بهتر از هوش مصنوعی. لحن، که مدتها به عنوان موضوعی بیاهمیت تلقی میشد، به طور فزایندهای به نظر میرسد به اندازه انتخاب کلمات اهمیت دارد.
محققان ۵۰ سوال پایه را در موضوعاتی مانند ریاضی، علم و تاریخ در پنج سطح لحن، از “بسیار مؤدبانه” تا “بسیار بیادبانه” بازنویسی کردند که در مجموع ۲۵۰ پرسش ایجاد شد. سپس از ChatGPT-4o خواسته شد تا به هر یک از این پرسشها پاسخ دهد و پاسخهای آن به دقت ارزیابی شد.
پیامدها فراتر از آداب و رسوم است. اگر احترام باعث انحراف دقت مدل شود، آنگاه ادعاهای عینی بودن نتایج هوش مصنوعی را زیر سوال میبرد. کاربران بیادب ممکن است، بهطور پارادوکسیکال، با عملکرد بهتری پاداش داده شوند.
منطق ماشینی و هنجارهای انسانی در تضاد هستند
چرا ممکن است عبارات blunt یا rude دقت را افزایش دهند؟ یک نظریه: درخواستهای مودبانه اغلب شامل عبارتهای غیرمستقیم هستند (“آیا میتوانید لطفاً بگویید…”) که ممکن است ابهام را به همراه داشته باشد. یک “جواب را به من بگو” مختصر، لایههای زبانی اضافی را کنار میزند و هدف واضحتری به مدلها میدهد.
با این حال، یافتهها تأکید میکنند که چقدر هوش مصنوعی از همدلی انسانی فاصله دارد: همان کلمات که تبادل اجتماعی بین افراد را نرم میکند، ممکن است منطق ماشین را مبهم کند.
این مقاله هنوز مورد بررسی همتا قرار نگرفته است، اما در حال حاضر در بین مهندسان پرامپت و محققان جلب توجه کرده است، که آن را نشانهای میدانند که ممکن است مدلهای آینده نیاز داشته باشند. تنظیم اجتماعی —نه تنها تنظیمات فنی دقیق.
به هر حال، این باید برای هیچکس شوکهکننده نباشد. بعد از همه، مدیرعامل اوپنای آی، سم آلتمن ما را هشدار داد. که گفتن لطفاً و متشکرم استفاده از چت جیپیتی هدر دادن زمان و پول بود.
بهطور کلی هوشمند خبرنامه
یک سفر هفتگی در دنیای هوش مصنوعی که توسط جن، یک مدل هوش مصنوعی تولیدی روایت میشود.