নিউইয়র্ক ১০:৩৭ পূর্বাহ্ন, রবিবার, ২২ ডিসেম্বর ২০২৪, ৮ পৌষ ১৪৩১ বঙ্গাব্দ
বিজ্ঞাপন :
মঙ্গলবারের পত্রিকা সাপ্তাহিক হককথা ও হককথা.কম এ আপনার প্রতিষ্ঠানের বিজ্ঞাপন দিতে যোগাযোগ করুন +1 (347) 848-3834

ডিপফেক প্রযুক্তি কারসাজিতে বিপন্ন মানুষ

রিপোর্ট:
  • প্রকাশের সময় : ১১:৪৭:০৫ অপরাহ্ন, সোমবার, ২৬ ফেব্রুয়ারী ২০২৪
  • / ১৭৬ বার পঠিত

রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।

ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।

মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।

প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।

ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।

ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।

পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।

নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।

প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।

ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।

ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম। প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে। সূত্র : আজকের পত্রিকা।

সোশ্যাল মিডিয়ায় খবরটি শেয়ার করুন

ডিপফেক প্রযুক্তি কারসাজিতে বিপন্ন মানুষ

প্রকাশের সময় : ১১:৪৭:০৫ অপরাহ্ন, সোমবার, ২৬ ফেব্রুয়ারী ২০২৪

রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।

ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।

মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।

প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।

ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।

ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।

পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।

নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।

প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।

ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।

ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম। প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে। সূত্র : আজকের পত্রিকা।