অ্যামাজন সেজমেকার দিয়ে কীভাবে জেনারেটিভ এআই ইমেজ তৈরি করবেন

Rifat Business Oct 3, 2024

কৃত্রিম বুদ্ধিমত্তার বিশ্ব (AI) সাম্প্রতিক বছরগুলিতে উল্লেখযোগ্য অগ্রগতি প্রত্যক্ষ করেছে, এবং চিত্র-উৎপাদনকারী AI সবচেয়ে চিত্তাকর্ষক এবং দ্রুত বিকশিত ক্ষেত্রগুলির মধ্যে একটি হিসাবে আবির্ভূত হয়েছে। এই অত্যাধুনিক প্রযুক্তি আমাদের নিছক পাঠ্য বর্ণনা থেকে অত্যাশ্চর্য, বাস্তবসম্মত ছবি তৈরি করতে, সীমাহীন সৃজনশীল সম্ভাবনার ক্ষেত্র উন্মুক্ত করে।

ইমেজ-জেনারেটিভ এআই মডেলগুলি গভীর শিক্ষার অ্যালগরিদম এবং টেক্সট এবং ভিজ্যুয়াল উপস্থাপনাগুলির মধ্যে জটিল নিদর্শন এবং সম্পর্কগুলি শিখতে এবং বোঝার জন্য প্রচুর পরিমাণে প্রশিক্ষণ ডেটার সুবিধা দেয়। একটি সাধারণ পাঠ্য প্রম্পট প্রদান করে, এই মডেলগুলি সম্পূর্ণ নতুন চিত্রগুলিকে সংশ্লেষ করতে পারে যা প্রদত্ত বিবরণের সাথে উল্লেখযোগ্যভাবে সারিবদ্ধ, জটিল বিবরণ, শৈলী এবং রচনাগুলি ক্যাপচার করে।

আমাজন সেজমেকার কি?

Amazon SageMaker , AWS থেকে একটি সম্পূর্ণ-পরিচালিত মেশিন লার্নিং পরিষেবা, এন্ড-টু-এন্ড মেশিন লার্নিং ওয়ার্কফ্লোকে সহজ করে, দ্রুত এবং দক্ষ মডেল বিল্ডিং, প্রশিক্ষণ এবং স্থাপনা সক্ষম করে। এটি জটিল অবকাঠামোর কাজগুলিকে বিমূর্ত করে, যা ডেভেলপার এবং ডেটা বিজ্ঞানীদের তাদের মূল উদ্দেশ্যগুলিতে ফোকাস করতে এবং সময়-টু-বাজারকে ত্বরান্বিত করতে দেয়।

SageMaker বিল্ট-ইন অ্যালগরিদম, প্রাক-প্রশিক্ষিত মডেল এবং কাস্টম মডেলের জন্য সমর্থন প্রদান করে, নমনীয়তা এবং ইমেজ জেনারেটিভ এআই মডেল সহ সাম্প্রতিক অগ্রগতিতে অ্যাক্সেস নিশ্চিত করে। এর ব্যবহারকারী-বান্ধব ইন্টারফেস, সেজমেকার স্টুডিও, নিরবচ্ছিন্ন কোডিং, পরীক্ষা এবং স্থাপনার জন্য একটি সমন্বিত উন্নয়ন পরিবেশ প্রদান করে, সহযোগিতা বৃদ্ধি করে এবং উন্নয়ন প্রক্রিয়াকে সুগম করে।

আশ্চর্যজনক ওয়েবসাইট তৈরি করুন

সেরা বিনামূল্যে পৃষ্ঠা নির্মাতা Elementor সঙ্গে

এখুনি শুরু করুন

Amazon S3, EC2, এবং SageMaker Ground Truth এর মতো AWS পরিষেবাগুলির সাথে নিরবচ্ছিন্ন একীকরণ ব্যবহারকারীদের সম্পূর্ণরূপে একটি মসৃণ মেশিন-লার্নিং অভিজ্ঞতার জন্য AWS ইকোসিস্টেম ব্যবহার করতে দেয়৷ উন্নত বৈশিষ্ট্য যেমন স্বয়ংক্রিয় মডেল টিউনিং, বিতরণ করা প্রশিক্ষণ, এবং বিল্ট-ইন স্থাপনা, শক্তিশালী মনিটরিং এবং লগিং সরঞ্জাম সহ, মডেলের কর্মক্ষমতা এবং স্কেলেবিলিটি অপ্টিমাইজ করে। SageMaker সংস্থাগুলিকে তাদের মেশিন লার্নিং প্রকল্পগুলিকে ত্বরান্বিত করতে, অপারেশনাল ওভারহেড কমাতে এবং উদ্ভাবনী AI সমাধানগুলি সরবরাহ করতে সহায়তা করে৷

অ্যামাজন সেজমেকার দিয়ে শুরু করা

কনসোল থেকে Amazon SageMaker স্টুডিও চালু করা একটি সহজবোধ্য প্রক্রিয়া যা আপনাকে মেশিন লার্নিংয়ের জন্য একটি সম্পূর্ণ সমন্বিত উন্নয়ন পরিবেশ অ্যাক্সেস করতে দেয়। শুরু করতে এই পদক্ষেপগুলি অনুসরণ করুন:

  1. Amazon SageMaker কনসোল খুলুন
  2. বাম নেভিগেশন ফলকে, "স্টুডিও" বিকল্পটি সনাক্ত করুন এবং নির্বাচন করুন৷
  3. স্টুডিও ল্যান্ডিং পৃষ্ঠায়, আপনি উপলব্ধ ডোমেন এবং ব্যবহারকারী প্রোফাইলের একটি তালিকা দেখতে পাবেন। আপনি স্টুডিও চালু করতে ব্যবহার করতে চান এমন উপযুক্ত ডোমেন এবং ব্যবহারকারী প্রোফাইল নির্বাচন করুন।
  4. ডোমেন এবং ব্যবহারকারীর প্রোফাইল নির্বাচন করার পরে, "ওপেন স্টুডিও" বোতামে ক্লিক করুন।
  5. লঞ্চ চূড়ান্ত করতে, "ব্যক্তিগত স্টুডিও লঞ্চ করুন" নির্বাচন করুন।

এই পদক্ষেপগুলি অনুসরণ করে, আপনি দ্রুত অ্যামাজন সেজমেকার স্টুডিও অ্যাক্সেস করতে সক্ষম হবেন এবং আপনার মেশিন লার্নিং প্রকল্পগুলির জন্য এর শক্তিশালী বৈশিষ্ট্যগুলি ব্যবহার করা শুরু করবেন।

একটি জাম্পস্টার্ট চয়ন করুন

স্টেবল ডিফিউশন 2 মডেলটি আমাদের পাঠ্যের একটি সাধারণ লাইন থেকে চিত্র তৈরি করতে দেয়, এটি সামাজিক মিডিয়া পোস্ট, প্রচারমূলক সামগ্রী, অ্যালবাম কভার এবং অন্যান্য সৃজনশীল আর্টওয়ার্কের মতো বিষয়বস্তু তৈরির জন্য আদর্শ করে তোলে।

এই মডেলটি ব্যবহার করতে, জাম্পস্টার্ট থেকে, "স্থির ডিফিউশন 2" অনুসন্ধান করুন এবং এটি নির্বাচন করুন।

তারপর, "ডিপ্লয় মডেল" বিভাগে, "ডিপ্লয়মেন্ট কনফিগারেশন" প্রসারিত করতে ক্লিক করুন।

সেজমেকার হোস্টিং উদাহরণের জন্য, আপনার পছন্দসই উদাহরণের ধরণটি চয়ন করুন। এই উদাহরণের জন্য, আমরা ml.g5.2xlarge ব্যবহার করছি।

"এন্ডপয়েন্ট নাম" ক্ষেত্রে, টাইপ করুন demo-stabilityai-stable-diffusion-v2

স্থাপনা প্রক্রিয়া শুরু করতে "ডিপ্লয়" বোতামে ক্লিক করুন।

অনুগ্রহ করে মনে রাখবেন যে বড় মডেল স্থাপনে কিছু সময় লাগতে পারে। এই ক্ষেত্রে, এটি 25 মিনিট পর্যন্ত সময় নিতে পারে। একবার স্থাপনা সম্পূর্ণ হলে, শেষ পয়েন্টের স্থিতি "পরিষেবাতে" আপডেট হবে।

পাইথন কোড সহ জুপিটার নোটবুক অ্যাক্সেস করতে "ওপেন নোটবুক" নির্বাচন করুন।

এখানে 2 হিসাবে বিজ্ঞাপিত বক্সের কোড আছে।

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

এবং এখানে বক্স 3 এর জন্য।

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

এখন, প্রক্রিয়া শুরু করতে, প্রথম দুটি বক্স চালান।

তৃতীয় বাক্সে, প্রম্পটে প্রবেশ করুন এবং ব্লকটি চালান।

এখন ফলাফল দেখতে এক বা দেড় মিনিট অপেক্ষা করতে হবে।

আপনি যদি চান, খেলার জন্য অনেক উন্নত বিকল্প রয়েছে। এবং সেরা অংশ হল - এটি প্রতিবার একটি নতুন ছবি তৈরি করে।

ব্যবহারের পরে আপনার শেষ পয়েন্ট মুছে ফেলতে মনে রাখবেন। যেহেতু আমরা ml.g5.2xlarge ইন্সট্যান্স ব্যবহার করছি, তাই লেখার সময় এটির জন্য প্রতি ঘন্টায় প্রায় $1 বেশি চার্জ লাগে।

আপ মোড়ানো

Amazon SageMaker- এর ক্ষমতাকে কাজে লাগিয়ে, আপনি ইমেজ জেনারেটিভ এআই-এর সীমাহীন সম্ভাবনাকে আনলক করতে পারেন, আপনার সৃজনশীলতাকে জ্বালাতন করতে পারেন এবং ভিজ্যুয়াল কন্টেন্ট তৈরির পদ্ধতিতে বিপ্লব ঘটাতে পারেন। আপনি অভিব্যক্তির জন্য নতুন উপায় খুঁজছেন এমন একজন শিল্পী, আকর্ষক ভিজ্যুয়ালের প্রয়োজন একজন বিপণনকারী, বা ভার্চুয়াল প্রোটোটাইপিং অন্বেষণকারী একজন পণ্য ডিজাইনার হোক না কেন, এই প্রযুক্তিটি প্রচুর সুযোগ সরবরাহ করে।

Divi WordPress Theme