هوش مصنوعی Claude اکنون میتواند به مکالمات توهین آمیز پایان دهد

کابل تیلگراف – ۲۷م اسد سال ۱۴۰۴ خورشیدی
آنتروپیک از یک قابلیت جدید در پیشرفتهترین مدلهای هوش مصنوعی خود، Claude Opus 4 و 4.1 Claude Opus، رونمایی کرده است.
این مدلها اکنون توانایی پایاندادن یکطرفه مکالمه را دارند.
این ویژگی که به گفته شرکت فقط در «موارد نادر در تعاملات مضر یا توهینآمیز» فعال خواهد شد، به عنوان بخشی از یک برنامه تحقیقاتی گستردهتر پیرامون ایده «رفاه هوش مصنوعی» توسعه یافته است.
قابلیت جدید Claude یک مکانیزم دفاعی برای خود مدل هوش مصنوعی است.
براساس توضیحات Anthropic این ویژگی فقط به عنوان «آخرین راهحل» و پس از آنکه مدل چندین بار برای هدایت مجدد مکالمه به مسیری سازنده تلاش کرده و نا امید شده باشد، فعال میشود.
این موارد شامل درخواستهای شدیداً مضر مانند محتوای غیر اخلاقی مرتبط با کودکان یا تلاش برای بهدستآوردن اطلاعاتی است که به خشونت در مقیاس بزرگ یا اقدامات تروریستی منجر میشوند.
پس از پایان یافتن مکالمه، کاربر دیگر نمیتواند در آن چت پیام جدیدی ارسال کند>
اما میتواند بلافاصله یک گفتگوی جدید آغاز کند یا حتی پیامهای قبلی خود را در چت پایانیافته ویرایش کند تا مسیر مکالمه را تغییر دهد.