গো-তে কৃত্রিম মন যন্ত্রণাদায়ক লোকদের বহন করছে - মেশিনের বিদ্রোহ কি ঠিক কোণায়?
গো-তে কৃত্রিম মন যন্ত্রণাদায়ক লোকদের বহন করছে - মেশিনের বিদ্রোহ কি ঠিক কোণায়?

ভিডিও: গো-তে কৃত্রিম মন যন্ত্রণাদায়ক লোকদের বহন করছে - মেশিনের বিদ্রোহ কি ঠিক কোণায়?

ভিডিও: গো-তে কৃত্রিম মন যন্ত্রণাদায়ক লোকদের বহন করছে - মেশিনের বিদ্রোহ কি ঠিক কোণায়?
ভিডিও: ইউক্রেনে পশ্চিমারা কেন রাশিয়ার পরাজয় চায় না? রাশিয়া-ইউক্রেন যুদ্ধ | BBC Bangla 2024, এপ্রিল
Anonim

এতদিন আগে, দক্ষিণ কোরিয়ার গো মাস্টার এবং বিশ্বের অন্যতম শীর্ষস্থানীয় খেলোয়াড়, লি সেডল, তার অবসর ঘোষণা করেছিলেন এবং একটি নাটকীয় বিবৃতি দিয়েছেন: উন্মাদ প্রচেষ্টার মাধ্যমে রেটিং। এখন এমন একটি সত্তা আছে যাকে অতিক্রম করা যায় না”।

লি আলফাগো কম্পিউটার সম্পর্কে কথা বলেছেন, ডিপমাইন্ড দ্বারা তৈরি করা হয়েছে, যা গুগল পাঁচ বছর আগে $ 650 মিলিয়নে কিনেছিল। কোরিয়ান 2016 সালে গাড়ির কাছে হেরেছিল, কিন্তু তারপর থেকে কৃত্রিম বুদ্ধিমত্তা কেবল শক্তিশালী হয়ে উঠেছে। সাধারণভাবে, গো-তে একজন ব্যক্তির উপর কম্পিউটারের বিজয় একটি বাস্তব অগ্রগতি হিসাবে বিবেচিত হয়, যা সম্ভাব্যভাবে বিশ্বে বড় আকারের পরিবর্তন ঘটাতে পারে। টার্মিনেটর কি ইতিমধ্যেই দিগন্তে আছে? আসুন এটা বের করা যাক।

প্রোগ্রামাররা দীর্ঘকাল ধরে মানুষের সেরাদের সাথে চ্যালেঞ্জিং গেমগুলিতে কৃত্রিম বুদ্ধিমত্তার শক্তি পরীক্ষা করেছে৷ আইবিএম দ্বারা তৈরি ডিপ ব্লু কম্পিউটারটি 1997 সালে দাবা খেলায় গ্যারি কাসপারভকে পরাজিত করেছিল। ম্যাচের আগে কাসপারভ ভেবেছিলেন: “এটি কেবল একটি গাড়ি। মেশিনগুলো বোকা।"

কিন্তু পরাজয়ের পরে তিনি স্বীকার করেছিলেন: "আমি অনুভব করেছি - গন্ধ পেয়েছি - যে টেবিলে একটি নতুন ধরণের মন ছিল।"

কাসপারভকে পরাজিত করার জন্য, ডিপ ব্লু নিষ্ঠুর গণনা শক্তি ব্যবহার করেছিল: প্রতিটি পদক্ষেপের পরে, প্রোগ্রামটি সমস্ত সম্ভাব্য পরিস্থিতি গণনা করে এবং এই ডেটার উপর ভিত্তি করে একটি সিদ্ধান্ত নেয়। কিন্তু Go এর সাথে, এই পদ্ধতিটি কাজ করে না যে পরিমাণ ডেটা প্রক্রিয়াকরণ করা দরকার। যেতে যেতে, খেলোয়াড়রা পালাক্রমে 19 বাই 19 বোর্ডে কালো এবং সাদা পাথর স্থাপন করে। গেমের উদ্দেশ্য হল যতটা সম্ভব জায়গা দখল করা, প্রতিপক্ষের পাথরগুলিকে লক আপ করার সময়, তাকে একটি সুবিধা পেতে বাধা দেওয়া। সাধারণভাবে, গো স্কুল থেকে অনেকের কাছে পরিচিত ডট গেমের মতো - কেবল আরও কঠিন।

বোর্ডের আকারের কারণে, কালো পাথর দ্বারা তৈরি প্রথম পদক্ষেপের জন্য 361টি বৈকল্পিক ইতিমধ্যেই সম্ভব (দাবাতে - শুধুমাত্র 20)। তদনুসারে, প্রতিটি পদক্ষেপের সাথে, সম্ভাব্য প্রান্তিককরণের গাছ কেবল বৃদ্ধি পায়। প্রথম দুটি চালের পরে, দাবাতে 400টি সম্ভাব্য বিকাশ রয়েছে এবং 129,960টি যেতে হবে৷ গণিতবিদ জন ট্রম্প গণনা করেছেন যে সম্ভাব্য সংমিশ্রণের সংখ্যা হবে 171-সংখ্যার সংখ্যা৷

অতএব, গো-এর গেমে, লোকেদের শুধুমাত্র বুদ্ধিমত্তা এবং গণনা করার ক্ষমতাই নয়, শক্তিশালী বিমূর্ত চিন্তাভাবনা, শক্তিশালী অন্তর্দৃষ্টি - গুণাবলী যা কম্পিউটারে দুর্বলভাবে বিকাশ করা হয়। AlphaGo-এর একজন বিকাশকারী, ডেমিস হাসাবিস বলেছেন: "এটি একটি খুব স্বজ্ঞাত গেম। গো মাস্টাররা প্রায়ই বলে যে তারা একটি পদক্ষেপ নিয়েছে কারণ এটি সঠিক বলে মনে হয়েছিল।" তার মতে, মাস্টার একটি বিশেষ নান্দনিক অনুভূতি বিকাশ, এবং একটি ভাল অবস্থান শুধু সুন্দর দেখায়।

প্রসেসরগুলি প্রতি বছর আরও শক্তিশালী এবং দ্রুততর হয়ে উঠলেও, সম্ভাবনার গাছে চালনার অনুসন্ধান কৃত্রিম বুদ্ধিমত্তাকে কেবলমাত্র একটি শক্তিশালী অপেশাদারের স্তরে পৌঁছানোর অনুমতি দেয়। কম্পিউটার মানুষকে পরাজিত করে, কিন্তু মাত্র কয়েকটি পাথরের মধ্যেই শুরু হয়। 2014 সালে, ডেভিড ফোটল্যান্ড, কম্পিউটারের জন্য পথপ্রদর্শকদের একজন, বলেছিলেন যে প্রোগ্রামগুলি মানুষের মতো একই সমস্যার মুখোমুখি হয়:

“অনেক খেলোয়াড় একটি নির্দিষ্ট অপেশাদার শিখরে পৌঁছে এবং শক্তিশালী হতে পারে না। এই মালভূমিকে অতিক্রম করতে, আপনাকে কিছু ধরণের মানসিক লাফ দিতে হবে এবং প্রোগ্রামগুলির একই সমস্যা রয়েছে। আপনাকে শুধু স্থানীয় লড়াই নয়, পুরো বোর্ডের দিকে তাকাতে হবে”। এই বুদ্ধিবৃত্তিক বাধা অতিক্রম করতে এবং পেশাদারদের অন্তর্দৃষ্টি এবং নান্দনিক অনুভূতি অনুকরণ করতে, AlphaGo বিকাশকারীরা নিউরাল নেটওয়ার্ক এবং গভীর শিক্ষার অ্যালগরিদম সংযুক্ত করেছে।

প্রথমত, আলফাগোর নিউরাল নেটওয়ার্কগুলিকে মানব গেমগুলির একটি ডাটাবেস খাওয়ানো হয়েছিল, যার মধ্যে প্রায় 30 মিলিয়ন চাল অন্তর্ভুক্ত ছিল।এর পরে, তিনি একজন ব্যক্তির 57% সময় সঠিকভাবে ভবিষ্যদ্বাণী করতে শিখেছিলেন, যদিও আগের AI রেকর্ড ছিল 44%। তারপরে বিকাশকারীরা আলফাগোকে নিজের বিরুদ্ধে খেলতে শিখিয়েছে - তাই কম্পিউটার সবচেয়ে লাভজনক পদক্ষেপগুলি হাইলাইট করতে এবং নতুন কৌশলগুলি বিকাশ করতে আরও ভাল শিখেছে।

এই সমস্ত প্রক্রিয়াগুলিকে যুক্তিযুক্ত করতে সাহায্য করেছিল যার উপর ডিপ ব্লু, যিনি কাসপারভকে পরাজিত করেছিলেন, কাজ করেছিলেন। এখন সিস্টেমটি কেবল সমস্ত সম্ভাব্য সংমিশ্রণ চালায় না, তবে ইভেন্টগুলির বিকাশের জন্য সবচেয়ে প্রতিশ্রুতিবদ্ধ পরিস্থিতিতে কীভাবে ফোকাস করতে হয় তাও জানে। উপরন্তু, তিনি তার বিয়ারিংগুলি খুঁজে পান এমনকি এমন পরিস্থিতিতেও যা তিনি আগে কখনও সম্মুখীন হননি। এবং যেমন, গো এর স্কেলের কারণে, রয়ে গেছে। নতুন প্রক্রিয়ার কারণে, AlphaGo পূর্বে তৈরি করা সমস্ত কম্পিউটার প্লেয়ারকে পরাজিত করে (যখন তাদের চারটি পাথর দিয়ে শুরু করে) এবং পেশাদার লোকদের পরাজিত করতে শুরু করে।

2015 সালের অক্টোবরে, আলফাগো দুইবারের ইউরোপীয় চ্যাম্পিয়ন ফরাসি ফ্যান হুইকে পরাজিত করে। তারা পাঁচটি গেম খেলেছে, কেউই শুরু করতে পারেনি, এবং কম্পিউটার পাঁচটি জিতেছে। এই প্রথম কোনও পেশাদার ব্যক্তিকে মেশিনের কাছে পরাজিত করা হয়েছিল। ম্যাচের পরে, হুই বলেছিলেন যে তিনি অনেক কিছু শিখেছেন এবং এই জ্ঞান তাকে আন্তর্জাতিক র‌্যাঙ্কিংয়ে যোগ করতে এবং উঠতে সাহায্য করেছে।

প্রস্তাবিত: