تیکنالوژی

هوش مصنوعی Claude اکنون می‌تواند به مکالمات توهین آمیز پایان دهد

کابل تیلگراف – ۲۷م اسد سال ۱۴۰۴ خورشیدی

آنتروپیک از یک قابلیت جدید در پیشرفته‌ترین مدل‌های هوش مصنوعی خود، Claude Opus 4 و 4.1 Claude Opus، رونمایی کرده است.

این مدل‌ها اکنون توانایی پایان‌دادن یک‌طرفه مکالمه را دارند.

این ویژگی که به گفته شرکت فقط در «موارد نادر در تعاملات مضر یا توهین‌آمیز» فعال خواهد شد، به عنوان بخشی از یک برنامه تحقیقاتی گسترده‌تر پیرامون ایده «رفاه هوش مصنوعی» توسعه یافته است.

قابلیت جدید Claude یک مکانیزم دفاعی برای خود مدل هوش مصنوعی است.

براساس توضیحات Anthropic این ویژگی فقط به عنوان «آخرین راه‌حل» و پس از آنکه مدل چندین بار برای هدایت مجدد مکالمه به مسیری سازنده تلاش کرده و نا امید شده باشد، فعال می‌شود.

این موارد شامل درخواست‌های شدیداً مضر مانند محتوای غیر اخلاقی مرتبط با کودکان یا تلاش برای به‌دست‌آوردن اطلاعاتی است که به خشونت در مقیاس بزرگ یا اقدامات تروریستی منجر می‌شوند.

پس از پایان یافتن مکالمه، کاربر دیگر نمی‌تواند در آن چت پیام جدیدی ارسال کند>

اما می‌تواند بلافاصله یک گفتگوی جدید آغاز کند یا حتی پیام‌های قبلی خود را در چت پایان‌یافته ویرایش کند تا مسیر مکالمه را تغییر دهد.