วิธีการสร้างภาพ Generative AI ด้วย Amazon Sagemaker

Rifat ธุรกิจ Oct 3, 2024

โลกของปัญญาประดิษฐ์ (AI) ได้เห็นความก้าวหน้าอย่างน่าทึ่งในช่วงไม่กี่ปีที่ผ่านมา และปัญญาประดิษฐ์ที่สร้างภาพได้กลายมาเป็นหนึ่งในสาขาที่น่าสนใจที่สุดและมีการพัฒนาอย่างรวดเร็ว เทคโนโลยีที่ล้ำสมัยนี้ช่วยให้เราสร้างภาพที่สวยงามสมจริงจากคำอธิบายข้อความเพียงอย่างเดียว เปิดโอกาสให้มีความเป็นไปได้ในการสร้างสรรค์ที่ไร้ขีดจำกัด

โมเดล AI ที่สร้างภาพใช้ประโยชน์จากอัลกอริทึมการเรียนรู้เชิงลึกและข้อมูลฝึกอบรมจำนวนมากเพื่อเรียนรู้และทำความเข้าใจรูปแบบและความสัมพันธ์ที่ซับซ้อนระหว่างข้อความและการแสดงภาพ ด้วยการให้ข้อความง่ายๆ โมเดลเหล่านี้สามารถสร้างภาพใหม่ทั้งหมดที่สอดคล้องกับคำอธิบายที่กำหนดไว้ได้อย่างน่าทึ่ง โดยจับภาพรายละเอียด สไตล์ และองค์ประกอบที่ซับซ้อน

Amazon Sagemaker คืออะไร?

Amazon SageMaker บริการการเรียนรู้ของเครื่องที่บริหารจัดการอย่างเต็มรูปแบบจาก AWS ช่วยลดความซับซ้อนของเวิร์กโฟลว์การเรียนรู้ของเครื่องแบบครบวงจร ช่วยให้สร้างแบบจำลอง ฝึกอบรม และปรับใช้ได้อย่างรวดเร็วและมีประสิทธิภาพ นอกจากนี้ยังสรุปงานโครงสร้างพื้นฐานที่ซับซ้อน ช่วยให้นักพัฒนาและนักวิทยาศาสตร์ข้อมูลสามารถมุ่งเน้นไปที่วัตถุประสงค์หลักและเร่งเวลาในการนำออกสู่ตลาด

SageMaker นำเสนออัลกอริทึมในตัวที่หลากหลาย โมเดลที่ผ่านการฝึกอบรมล่วงหน้า และการรองรับโมเดลที่กำหนดเอง ช่วยให้มีความยืดหยุ่นและสามารถเข้าถึงความก้าวหน้าล่าสุดได้ รวมถึงโมเดล AI ที่สร้างภาพได้ อินเทอร์เฟซที่ใช้งานง่ายอย่าง SageMaker Studio มอบสภาพแวดล้อมการพัฒนาแบบบูรณาการสำหรับการเข้ารหัส การทดสอบ และการปรับใช้ที่ราบรื่น ช่วยเพิ่มประสิทธิภาพการทำงานร่วมกันและปรับปรุงกระบวนการพัฒนา

สร้างเว็บไซต์ที่น่าทึ่ง

ด้วย Elementor ตัวสร้างหน้าฟรีที่ดีที่สุด

เริ่มเลย

การบูรณาการที่ราบรื่นกับบริการ AWS เช่น Amazon S3, EC2 และ SageMaker Ground Truth ช่วยให้ผู้ใช้สามารถใช้ระบบนิเวศ AWS เพื่อประสบการณ์การเรียนรู้ของเครื่องที่ราบรื่นได้อย่างเต็มที่ คุณสมบัติขั้นสูง เช่น การปรับแต่งโมเดลอัตโนมัติ การฝึกอบรมแบบกระจาย และการปรับใช้ในตัว พร้อมด้วยเครื่องมือตรวจสอบและบันทึกข้อมูลที่มีประสิทธิภาพ ช่วยเพิ่มประสิทธิภาพและความสามารถในการปรับขนาดของโมเดล SageMaker ช่วยให้องค์กรเร่งโครงการการเรียนรู้ของเครื่อง ลดค่าใช้จ่ายในการดำเนินงาน และส่งมอบโซลูชัน AI ที่เป็นนวัตกรรม

เริ่มต้นใช้งาน Amazon Sagemaker

การเปิดใช้งาน Amazon SageMaker Studio จากคอนโซลเป็นกระบวนการที่ตรงไปตรงมาซึ่งช่วยให้คุณสามารถเข้าถึงสภาพแวดล้อมการพัฒนาแบบบูรณาการเต็มรูปแบบสำหรับการเรียนรู้ของเครื่องได้ ปฏิบัติตามขั้นตอนเหล่านี้เพื่อเริ่มต้น:

  1. เปิด คอนโซล Amazon SageMaker
  2. ในบานหน้าต่างนำทางด้านซ้าย ค้นหาและเลือกตัวเลือก "สตูดิโอ"
  3. ในหน้าเริ่มต้นของ Studio คุณจะเห็นรายการโดเมนและโปรไฟล์ผู้ใช้ที่พร้อมใช้งาน เลือกโดเมนและโปรไฟล์ผู้ใช้ที่เหมาะสมที่คุณต้องการใช้ในการเปิดตัว Studio
  4. หลังจากเลือกโดเมนและโปรไฟล์ผู้ใช้แล้ว ให้คลิกที่ปุ่ม "เปิดสตูดิโอ"
  5. หากต้องการสรุปการเปิดตัว ให้เลือก "เปิดตัว Studio ส่วนตัว"

หากทำตามขั้นตอนเหล่านี้ คุณจะสามารถเข้าถึง Amazon SageMaker Studio ได้อย่างรวดเร็ว และเริ่มใช้ประโยชน์จากคุณลักษณะอันทรงพลังของมันสำหรับโปรเจ็กต์การเรียนรู้ของเครื่องของคุณได้

เลือก JumpStart

โมเดล Stable Diffusion 2 ช่วยให้เราสร้างภาพจากข้อความบรรทัดเดียว ทำให้เหมาะอย่างยิ่งสำหรับการสร้างเนื้อหา เช่น โพสต์บนโซเชียลมีเดีย สื่อส่งเสริมการขาย ปกอัลบั้ม และงานศิลปะสร้างสรรค์อื่นๆ

ในการใช้โมเดลนี้ ให้ค้นหา "Stable Diffusion 2" จาก JumpStart และเลือก

จากนั้นในส่วน "โมเดลการปรับใช้" ให้คลิกเพื่อขยาย "การกำหนดค่าการปรับใช้"

สำหรับอินสแตนซ์โฮสติ้ง SageMaker ให้เลือกประเภทอินสแตนซ์ที่คุณต้องการ สำหรับตัวอย่างนี้ เราใช้ ml.g5.2xlarge

ในช่อง "ชื่อจุดสิ้นสุด" พิมพ์ demo-stabilityai-stable-diffusion-v2

คลิกปุ่ม "ปรับใช้" เพื่อเริ่มกระบวนการปรับใช้

โปรดทราบว่าการปรับใช้โมเดลขนาดใหญ่กว่าอาจใช้เวลาสักครู่ ในกรณีนี้ อาจใช้เวลานานถึง 25 นาที เมื่อการปรับใช้เสร็จสิ้น สถานะของจุดสิ้นสุดจะอัปเดตเป็น "กำลังใช้งาน"

เลือก "เปิดสมุดบันทึก" เพื่อเข้าถึงสมุดบันทึก Jupyter ด้วยโค้ด Python

นี่คือโค้ดสำหรับกล่องที่แจ้งเป็น 2

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

และนี่คือกล่องที่ 3

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

ในตอนนี้ ให้เริ่มกระบวนการโดยรันกล่องสองกล่องแรก

ที่ช่องที่สาม ให้กรอกพร้อมท์และรันบล็อค

ตอนนี้คุณต้องรอสักหนึ่งหรือครึ่งนาทีเพื่อดูผลลัพธ์

หากคุณต้องการ มีตัวเลือกขั้นสูงมากมายให้เลือกใช้ และส่วนที่ดีที่สุดก็คือ มันสร้างภาพใหม่ทุกครั้ง

อย่าลืมลบปลายทางของคุณหลังจากใช้งาน เนื่องจากเราใช้อินสแตนซ์ ml.g5.2xlarge จึงมีค่าบริการที่สูงขึ้น โดยอยู่ที่ประมาณ 1 ดอลลาร์ต่อชั่วโมงในขณะที่เขียนบทความนี้

การห่อหุ้ม

การใช้ประโยชน์จากความสามารถของ Amazon SageMaker จะช่วยให้คุณปลดล็อกศักยภาพที่ไร้ขีดจำกัดของ AI ที่สร้างภาพได้ กระตุ้นความคิดสร้างสรรค์ของคุณและปฏิวัติวิธีการสร้างเนื้อหาภาพของคุณ ไม่ว่าคุณจะเป็นศิลปินที่กำลังมองหาช่องทางใหม่ๆ ในการแสดงออก นักการตลาดที่ต้องการภาพที่สวยงาม หรือเป็นนักออกแบบผลิตภัณฑ์ที่กำลังสำรวจการสร้างต้นแบบเสมือนจริง เทคโนโลยีนี้มอบโอกาสมากมายให้กับคุณ

Divi WordPress Theme