এআই-জেনারেটেড টেক্সট কিভাবে স্পট করবেন
যেহেতু বৃহৎ ভাষার মডেলগুলি একটি বাক্যে পরবর্তী শব্দের ভবিষ্যদ্বাণী করে কাজ করে, তাই তারা অস্বস্তিকর, বিরল শব্দের পরিবর্তে “the,” “it,” বা “is” এর মতো সাধারণ শব্দ ব্যবহার করার সম্ভাবনা বেশি। এটি ঠিক সেই ধরনের টেক্সট যা অটোমেটেড ডিটেক্টর সিস্টেম বাছাই করতে ভাল, Ippolito এবং Google-এর গবেষকদের একটি দল 2019 সালে প্রকাশিত গবেষণায় খুঁজে পেয়েছে।
কিন্তু ইপপোলিটোর অধ্যয়নটিও কিছু আকর্ষণীয় দেখায়: মানব অংশগ্রহণকারীরা মনে করতেন যে এই ধরনের “পরিষ্কার” পাঠ্য আরও ভাল দেখায় এবং এতে কম ভুল রয়েছে এবং এইভাবে এটি অবশ্যই একজন ব্যক্তির দ্বারা লেখা হয়েছে।
বাস্তবে, মানব-লিখিত পাঠ্য টাইপোতে ধাঁধাঁযুক্ত এবং এটি অবিশ্বাস্যভাবে পরিবর্তনশীল, বিভিন্ন শৈলী এবং অপভাষাকে অন্তর্ভুক্ত করে, যখন “ভাষা মডেলগুলি খুব কমই টাইপো করে। তারা নিখুঁত পাঠ্য তৈরিতে অনেক ভাল,” ইপপোলিটো বলেছেন।
“পাঠ্যটিতে একটি টাইপো আসলে একটি ভাল সূচক যে এটি মানুষের লেখা ছিল,” তিনি যোগ করেন।
এআই-উত্পন্ন পাঠ্য সনাক্ত করতে বড় ভাষা মডেলগুলিও ব্যবহার করা যেতে পারে। এটি করার সবচেয়ে সফল উপায়গুলির মধ্যে একটি হল মানুষের দ্বারা লিখিত কিছু পাঠ্যের উপর মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়া এবং অন্যগুলি মেশিন দ্বারা তৈরি করা, তাই এটি দুটির মধ্যে পার্থক্য করতে শিখেছে, মুহাম্মদ আবদুল-মাগিদ বলেছেন, যিনি প্রাকৃতিক কানাডার গবেষণা চেয়ার। ব্রিটিশ কলাম্বিয়া বিশ্ববিদ্যালয়ে ভাষা প্রক্রিয়াকরণ এবং মেশিন লার্নিং এবং সনাক্তকরণ অধ্যয়ন করেছেন।
স্কট অ্যারনসন, টেক্সাস বিশ্ববিদ্যালয়ের একজন কম্পিউটার বিজ্ঞানী, ওপেনএআই-তে এক বছর ধরে গবেষক হিসাবে দ্বিতীয়, ইতিমধ্যে, GPT-3-এর মতো মডেলগুলির দ্বারা উত্পন্ন টেক্সটের দীর্ঘ টুকরোগুলির জন্য ওয়াটারমার্ক তৈরি করছেন—”এটি অন্যথায় অলক্ষিত গোপন সংকেত। শব্দের পছন্দ, যা আপনি পরে প্রমাণ করতে ব্যবহার করতে পারেন যে, হ্যাঁ, এটি জিপিটি থেকে এসেছে,” তিনি তার ব্লগে লিখেছেন।
ওপেনএআই-এর একজন মুখপাত্র নিশ্চিত করেছেন যে সংস্থাটি ওয়াটারমার্ক নিয়ে কাজ করছে এবং বলেছে যে এর নীতিগুলি বলে যে ব্যবহারকারীদের স্পষ্টভাবে AI দ্বারা তৈরি করা পাঠ্য নির্দেশ করা উচিত “যেভাবে কেউ যুক্তিসঙ্গতভাবে মিস বা ভুল বুঝতে না পারে।”
কিন্তু এই প্রযুক্তিগত সংশোধন বড় সতর্কতা সঙ্গে আসে. তাদের বেশিরভাগই AI ভাষার মডেলের সর্বশেষ প্রজন্মের বিরুদ্ধে একটি সুযোগ দাঁড়াতে পারে না, কারণ সেগুলি GPT-2 বা অন্যান্য পূর্ববর্তী মডেলগুলিতে নির্মিত। এই শনাক্তকরণ সরঞ্জামগুলির অনেকগুলি ভাল কাজ করে যখন প্রচুর পাঠ্য উপলব্ধ থাকে; চ্যাটবট বা ইমেল সহকারীর মতো কিছু নির্দিষ্ট ব্যবহারের ক্ষেত্রে এগুলি কম দক্ষ হবে, যা সংক্ষিপ্ত কথোপকথনের উপর নির্ভর করে এবং বিশ্লেষণের জন্য কম ডেটা সরবরাহ করে। এবং সনাক্তকরণের জন্য বৃহৎ ভাষার মডেল ব্যবহার করার জন্যও শক্তিশালী কম্পিউটার এবং এআই মডেলের অ্যাক্সেস প্রয়োজন, যা প্রযুক্তি সংস্থাগুলি অনুমতি দেয় না, আবদুল-মাগিদ বলেছেন।
Artificial intelligence
#এআইজনরটড #টকসট #কভব #সপট #করবন