সেরা ৭ আর্টিফিশিয়াল ইন্টেলিজেন্স প্রযুক্তি

Tuesday, 21 Mar 2023, 07:28 pm

কৃত্রিম বুদ্ধিমত্তা (AI) বলতে মেশিন বা কম্পিউটার প্রোগ্রাম দ্বারা কোনো সম্পূর্ন করাকে বোঝায় যে কাজগুলো করতে সাধারণত মানুষের বুদ্ধিমত্তার প্রয়োজন হয়, যেমন প্রাকৃতিক ভাষা বোঝা, রিকগনাইজ ইমেজেস, সিদ্ধান্ত নেওয়া ইত্যাদি।

Artificial Intelligence সিস্টেমগুলি তৈরি করা হয়েছে প্রচুর পরিমাণে ডেটা বিশ্লেষণ এবং তা ব্যাখ্যা করার জন্য, প্যাটার্নগুলি সনাক্ত করতে এবং সেই ডেটার উপর ভিত্তি করে প্রেডিকশন করতে তারা অভিজ্ঞতা থেকে শিখতে পারে, সময়ের সাথে সাথে তাদের কর্মক্ষমতা উন্নত করতে পারে।  

AI বক্তৃতা স্বীকৃতি এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ থেকে স্ব-ড্রাইভিং গাড়ি এবং চিকিৎসা নির্ণয়ের জন্য বিস্তৃত অ্যাপ্লিকেশনগুলিতে ব্যবহৃত হয়। নিচে কিছু Artificial Intelligence মডেল আলোচনা করা হলো:


Resnet: ResNet এর পূর্নরুপ হলো Residual Neural Network, ResNet হল একটি ডিপ লার্নিং আর্কিটেকচার যা ২০১৫ সালে মাইক্রোসফ্ট গবেষকরা  প্রবর্তন করেছিলেন। এটি এক ধরনের কনভোলিউশনাল নিউরাল নেটওয়ার্ক (CNN) যা অদৃশ্য হয়ে যাওয়া গ্রেডিয়েন্টের সমস্যা সমাধানের জন্য তৈরি করা হয়েছে।

ResNet-এর পিছনে মূল ধারণা হল নেটওয়ার্কের মাধ্যমে তথ্যকে আরও সহজে প্রবাহিত করা  , শর্টকাট সংযোগ বা অবশিষ্ট সংযোগ হিসাবে পরিচিত এবং স্কিপ সংযোগগুলি ব্যবহার করা।  এই স্কিপ সংযোগগুলি নেটওয়ার্ককে অবশিষ্ট ম্যাপিং শিখতে সাহায্য করে , যা একটি নির্দিষ্ট স্তরের ইনপুট এবং আউটপুটের মধ্যে পার্থক্য দেখায়।  এটি করার মাধ্যমে, ResNet  ডিগ্রেডেশন সমস্যা এড়াতে পারে।

ResNet কম্পিউটার ভিশন সম্প্রদায়ের মধ্যে একটি খুব জনপ্রিয় আর্কিটেকচার হয়ে উঠেছে এবং এটি বিভিন্ন ধরনের কাজের জন্য ব্যবহৃত হয়েছে, যেমন ইমেজ শ্রেণীবিভাগ, অবজেক্ট ডিটেকশন এবং সেগমেন্টেশন। এটি ইমেজনেট ডেটাসেট সহ বেশ কয়েকটি বেঞ্চমার্কে অত্যাধুনিক ফলাফল অর্জন করেছে, যা একটি বড় আকারের ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জ।

 

DALL-E: DALL-E হল একটি কৃত্রিম বুদ্ধিমত্তা মডেল যা OpenAI দ্বারা তৈরি করা হয়েছে, যার অর্থ হল “Dali + Wall-E।“  এটি একটি জেনারেটিভ মডেল যা  টেক্সচুয়াল ডেসক্রিপশন থেকে হাই কোয়ালিটি এবং অরিজনাল ছবি তৈরি করতে পারে।

অন্যান্য ইমেজ জেনারেটিনহ মডেলের থেকে  DALL-E এমন চিত্র তৈরি করতে পারে যা কোনো ফটোগ্রাফ বা চিত্রের উপর ভিত্তি করে নয়, বরং  টেক্সচুয়াল ডেসক্রিপশনের উপর ভিত্তি করে সম্পূর্ণ নতুন এবং মূল বিষয়বস্তু তৈরি করতে পারে।  উদাহরণস্বরূপ, Dall E কে অ্যাভোকাডোর আকারে আর্মচেয়ার” এর মতো একটি টেক্সট প্রম্পট দেওয়া হলো Dall E ঠিক এমনি একটি চিত্র তৈরি করতে পারে।

DALL-E এই ইমেজগুলো ক্রিয়েট করতে  এবং ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এবং কম্পিউটার ভিশন  টেকনিকগুলো  কম্বিনশনগুলো  ব্যবহার করে।  মডেলটিকে ইমেজ-টেক্সট তৈরির জন্য ডেটাসেটে প্রশিক্ষণ দেওয়া হয় এবং টেক্সট ইনপুট প্রসেস করতে এবং ইমেক তৈরি করতে একটি ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে।

DALL-E 2021 সালের শুরুর দিকে এটির প্রকাশের পর থেকে কৃত্রিম বুদ্ধিমত্তা এবং সৃজনশীল সম্প্রদায়ের প্রতি অনেক আগ্রহ তৈরি করেছে৷ এটিতে আমাদের পণ্য তৈরি এবং ডিজাইন করার পদ্ধতিতে বিপ্লব ঘটানোর পাশাপাশি শৈল্পিক অভিব্যক্তির নতুন ফর্ম তৈরি করার সম্ভাবনা রয়েছে৷

 

VGG : VGG (Visual Geometry Group) হল অক্সফোর্ড বিশ্ববিদ্যালয়ের একটি গবেষণা গ্রুপ যা কম্পিউটার ভিশন এবং মেশিন লার্নিং এর উপর ভিত্তি করে।  ভিজিজি দল ডিপ লার্নিং ক্ষেত্রে বিশেষ করে কনভোল্যুশনাল নিউরাল নেটওয়ার্কের (সিএনএন) ক্ষেত্রে উল্লেখযোগ্য অবদান রেখেছে ২০১৪ সালে, VGG টিম একটি ডিপ CNN আর্কিটেচার ইনভেন্ট করে যা ইমেজনেট লার্জ স্কেল ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জ (ILSVRC) স্টেট অফ আর্ট পারফরম্যান্স অ্যাচিভ করে।

VGG নেটওয়ার্কের মধ্যে রয়েছে একটি কনভোল্যুশনাল লেয়ার, রয়েছে পুলিং লেয়ার  যার শেষে তিনটি কানেকটেড লেয়ার। কনভোলিউশনাল লেয়ারগুলিকে 3x3 ফিল্টার এবং 1 এর স্ট্রাইড সহ দুই বা তিনটি স্তরের ব্লকে সাজানো হয়, তারপরে 2 এর স্ট্রাইড সহ 2x2 পুলিং লেয়ার।  াটার্নটি বেশ কয়েকবার  রিপিট হয়, নেটওয়ার্ক গভীর হওয়ার সাথে সাথে ফিল্টারের সংখ্যা বৃদ্ধি পায়।

ভিজিজি আর্কিটেকচারের অন্যতম প্রধান বৈশিষ্ট্য হল খুব ছোট ফিল্টার ব্যবহার করা।  বড় ফিল্টারগুলির পরিবর্তে 3x3 ফিল্টার ব্যবহার করে, VGG কার্যকারিতা ত্যাগ না করে অনেক গভীরতার সাথে একটি নেটওয়ার্ক তৈরি করা। এছাড়াও, ছোট ফিল্টারগুলির ব্যবহার আরও স্থানীয় এবং সূক্ষ্ম-দানাযুক্ত বৈশিষ্ট্য উপস্থাপন করে। যা বস্তু সনাক্তকরণ এবং বিভাজনের মতো কাজের জন্য গুরুত্বপূর্ণ হতে পারে।

ভিজিজি ইনভেন্ট এর পর থেকে, এর আর্কিটেকচারটি ইমেজ ক্লাসিফিকেশন অব্জেক্ট ডিটেকশন এবং সেগমেন্টেশন সহ অনেক অ্যাপ্লিকেশনে ব্যবহৃত হয়েছে।  এটি রেসনেট আর্কিটেকচারে অবশিষ্ট সংযোগের ব্যবহার এবং ইনসেপশন আর্কিটেকচারে সমান্তরাল পাথওয়েতে ব্যবহার করার মতো অসংখ্য বৈচিত্র  ইন্সপায়ার করেছে।

 

AlexNet: অ্যালেক্সনেট হলো একটি ডিপ কনভোলিউশনাল নিউরাল নেটওয়ার্ক আর্কিটেকচার যা ২০১২ সালে অ্যালেক্স ক্রিজেভস্কি, ইলিয়া সুটস্কেভার এবং জিওফ্রে হিন্টন  তৈরি করেছিলেন। এটি ২০১২ সালে কম্পিউটারে একটি প্রতিযোগিতায় ইমেজনেট লার্জ স্কেল ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জে (ILSVRC) বিজয়ী হয়েছিলো । এই প্রতিযোগিতায় বিশ্বজুড়ে অনেক টিম অংশগ্রহণ করে এবং এমন কিছু মডেল  তৈরি করে যা সঠিকভাবে ক্লাসিফাই করতে পারে এবং বড় আকারের ইমেজ অবজেক্টগুলো ডিটেক্ট করতে পারে৷

২০১২ সালে  অ্যালেক্সনেটকে ছবি নেটওয়ার্ক লার্জ স্কেল ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জ (ILSVRC) কম্পিটিশন করার জন্য ক্রিয়েট করা হয়। যেখানে এটি 15.3% শীর্ষ-5 ভুলের হার গেইন করেছে, যা আগের আল্ট্রামডার্ন ভুলের হার 26.2% এর চেয়ে উল্লেখযোগ্যভাবে ভালো।  এটি ছিল প্রথম ডিপ নিউরাল নেটওয়ার্ক যা ILSVRC জয় করেছে এবং এর সাফল্য ডিপ লার্নিং এর  পরবর্তী উন্নয়নের পথ প্রশস্ত করেছে।

অ্যালেক্সনেট ডিপ লার্নিং এর  ক্ষেত্রে উল্লেখযোগ্য প্রভাব ফেলেছে, এবং এর আর্কিটেকচারকে পরবর্তী অনেক মডেলের ভিত্তি হিসেবে ব্যবহার করা হয়েছে।

 

BERT:  BERT এর পূর্নরুপ হলো Bidirectional Encoder Representations from Transformers এটি  ল্যাঙ্গুয়েজ প্রসেসের (NLP) জন্য একটি প্রি-ট্রেইন্ড ডিপ লার্নিং মডেল যা ২০১৮ সালে Google দ্বারা তৈরি করা হয়েছে। এটি ট্রান্সফরমার আর্কিটেকচারের উপর ভিত্তি করে তৈরি করা হয়েছে, যা ডেটার সিকোয়েন্স প্রক্রিয়া করার জন্য তৈরিকৃত একটি নিউরাল নেটওয়ার্ক আর্কিটেকচার।

BERT কে  ডিপ লার্নিং  নিউরাল নেটওয়ার্ক দ্বারা প্রচুর পরিমাণে লেবেলবিহীন ডেটাতে প্রশিক্ষণ দিয়ে  একটি টেক্সট কর্পাসে শব্দের রিপ্রেজেন্টেশন শেখার জন্য তৈরি করা হয়েছে।  মডেলটি দুটি কাজের জন্য প্রি-ট্রেইন্ড: মাস্ক ল্যাঙ্গুয়েজ মডেলিং (এমএলএম) এবং পরবর্তী বাক্য প্রেডিকশন (এনএসপি)।  এনএসপিতে, মডেলটিকে একটি ওয়ার্ড কর্পাসে দুটি বাক্য একে অপরকে অনুসরণ করে কিনা তা প্রেডিকশন করতে প্রশিক্ষণ দেওয়া হয়।

BERT-এর অন্যতম প্রধান উদ্ভাবন হল এর বিডিরেকশনাল কনটেক্সট ব্যবহার, যা মডেলটিকে উভয় দিকের কনটেক্সট উপর ভিত্তি করে একটি শব্দের অর্থ ক্যাপচার করতে দেয়।  এটি পূর্ববর্তী এনএলপি মডেলগুলির বিপরীতে, যা শুধুমাত্র একমুখী কনটেক্সট ব্যবহার করে।

 

BERT প্রকাশের পর থেকে, এর ব্যবহার ক্রমবর্ধমানভাবে বেড়ে উঠেছে এবং ইনফ্লুয়েনশিয়াল NLP কৌশলগুলির মধ্যে অন্যতম হয়ে উঠেছে। BERT-কে অন্যান্য এনএলপি কৌশলগুলির ভিত্তি হিসাবেও ব্যবহার করা হয়েছে, যেমন GPT-2 এবং GPT-3, যা মেশিনের ভাষা বোঝার তৈরি করা হয়েছে।

 

InceptionNet: InceptionNet, GoogleNet নামেও পরিচিত, হল একটি ডিপ নিউরাল নেটওয়ার্ক আর্কিটেকচার যা ২০১৪ সালে Google গবেষকরা ইমেজ রিকগনিশনের জন্য আবিষ্কার করে। এটি “ইনসেপশন মডিউল” ধারণার উপর ভিত্তি করে তৈরি করা হয়েছে, যা একাধিক স্থানিক স্কেলে দক্ষতার সাথে তথ্য প্রক্রিয়া করার জন্য তৈরি করা হয়েছে৷

ইনসেপশননেট আর্কিটেকচারে বিভিন্ন ফিল্টার সাইজ সহ কনভোলিউশনাল নিউরাল নেটওয়ার্কের (CNN) একাধিক স্তর রয়েছে, যা নেটওয়ার্ককে বিভিন্ন স্কেলে বৈশিষ্ট্যগুলি ক্যাপচার করতে দেয়। উপরন্তু, ইনসেপশননেট আর্কিটেকচার “ইনসেপশন মডিউল” ব্যবহার করে যা বিভিন্ন ফিল্টার আকারের সাথে প্যারালাল কনভোল্যুশন সঞ্চালনের জন্য তৈরি করা হয়েছে।

InceptionNet 2014 সালে ইমেজনেট লার্জ স্কেল ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জ (ILSVRC) ডেটাসেটে অত্যাধুনিক ফলাফল অর্জন করেছে, যার নির্ভুলতা 74.8%, যা আগের সেরা পারফরম্যান্সের 73.8% থেকে উল্লেখযোগ্যভাবে বেশি।  সেই থেকে, ইনসেপশননেট ইমেজ শনাক্তকরণের জন্য একটি মানদণ্ড হিসেবে ব্যাপকভাবে ব্যবহৃত হয়েছে এবং এটি রেসনেট এবং ডেনসনেটের মতো আরও অনেক ডিপ লার্নিং  আর্কিটেকচারকে অনুপ্রাণিত করেছে।

LSTM: LSTM কি?


LSTM-এর পূর্নরুপ হলো Long Short-Term Memory এবং এটি এক ধরনের  নিউরাল নেটওয়ার্ক (RNN) আর্কিটেকচার যা ট্রেডিশনাল RNN-এ গ্রেডিয়েন্টের অদৃশ্য হওয়ার সমস্যাকে সমাধান করার জন্য তৈরি করা হয়েছে।   

LSTM-এর মূল উদ্দেশ্য হলো “মেমরি সেল” যোগ করা যা একটি নির্দিষ্ট সময়ের জন্য তথ্য সঞ্চয় করতে পারে, যা প্রয়োজন অনুযায়ী নেটওয়ার্ককে বেছে বেছে তথ্য মনে রাখতে বা ভুলে যেতে সাহায্য করবে। এটিরে এলএসটিএম-এর “গেট” রয়েছে যা ইনপুট গেট, ভুলে যাওয়া গেট এবং আউটপুট গেট সহ মেমরি কোষে এবং বাইরে তথ্যের প্রবাহ নিয়ন্ত্রণ করে।

ইনপুট গেট মেমরি কোষে নতুন তথ্যের প্রবাহ নিয়ন্ত্রণ করে, যখন ভুলে গেটটি পুরানো তথ্য ধরে রাখা হয় তা নিয়ন্ত্রণ করে।  আউটপুট গেট মেমরি সেল থেকে এবং নেটওয়ার্কের বাকি অংশে তথ্যের প্রবাহ নিয়ন্ত্রণ করে।

 

 


 

Tagged with:

Related Posts

Post a comment

Full Name
Message