Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

ที่มาภาพ: Android Authority

AI5 มิถุนายน 2569 เวลา 12:00อ่าน 6 นาทีAndroid Authority

Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

⚡ สรุป 30 วิ

Google เปิดให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni แก่สมาชิกพรีเมียม ซึ่งผู้ใช้สามารถอัปโหลดภาพและเสียงเพื่อสร้างโคลนดิจิทัลที่พูดและเคลื่อนไหวได้ ระบบใส่…

Google เปิดให้ฟีเจอร์ Avatar ของ Gemini‑Omni ขยายการให้บริการแก่สมาชิกแบบชำระเงินในแอป Gemini อย่างเป็นทางการ — ผู้ใช้สามารถสร้าง “โคลน” ดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยอัตโนมัติ

Overview

Gemini เป็นชุดโมเดล AI ของ Google ที่พัฒนาโดยใช้ Omni model ซึ่งเป็นการรวมความสามารถหลายด้านเข้าด้วยกัน ทั้งการประมวลผลภาพและเสียงในเวลาเดียวกัน ฟีเจอร์ Avatar ที่เพิ่งเปิดตัวในเดือนที่ผ่านมา ให้ผู้ใช้สร้างตัวแทนดิจิทัลที่ดูเหมือนตนเองโดยอิงจากภาพถ่ายและการบันทึกเสียงของผู้ใช้เอง การทำงานของระบบเป็นแบบ “generative” ทำให้วิดีโอที่ได้มีลักษณะเป็นการพูดคุยแบบเรียลไทม์และเคลื่อนไหวตามอารมณ์ของเสียงที่ป้อนเข้าไป

แม้ว่า Gemini จะถูกออกแบบให้เป็นเครื่องมือสนับสนุนการสร้างคอนเทนต์และการสื่อสารในหลายรูปแบบ ฟีเจอร์ Avatar กลายเป็นจุดสนใจหลักเพราะความสามารถในการทำให้ผู้ใช้ “เป็นตัวเอง” บนแพลตฟอร์มดิจิทัลโดยไม่มีการถ่ายทำวิดีโอจริง ซึ่งอาจเปลี่ยนแปลงวิธีการผลิตสื่อส่วนบุคคลในอนาคต

How It Works

กระบวนการสร้าง Avatar เริ่มจากผู้ใช้ต้องอัปโหลดภาพใบหน้าที่ชัดเจนและบันทึกเสียงพูดตามคำแนะนำของแอป ระบบจะใช้ Omni model วิเคราะห์ข้อมูลเหล่านั้นเพื่อสร้างโมเดล 3 มิติของใบหน้าและเชื่อมต่อกับลักษณะเสียงของผู้ใช้ เมื่อเสร็จแล้วผู้ใช้สามารถพิมพ์ข้อความหรือพูดเพื่อให้ Avatar ทำการพูดออกมาในวิดีโอที่สร้างโดยอัตโนมัติ

การสร้างวิดีโอแต่ละครั้งจะมีการฝัง SynthID watermark ที่มองไม่เห็นด้วยตาเปล่า ซึ่งเป็นมาตรการของ Google เพื่อระบุว่าเนื้อหานั้นเป็นการสร้างโดย AI การฝังรหัสนี้ช่วยให้ผู้ตรวจสอบหรือแพลตฟอร์มอื่นสามารถตรวจจับและจัดการกับคอนเทนต์ที่อาจก่อให้เกิดการเข้าใจผิดหรือการใช้ในทางที่ไม่เหมาะสมได้

Availability & Requirements

การเปิดให้บริการ Avatar ในปัจจุบันจำกัดอยู่ที่สมาชิกที่สมัครใช้บริการแบบชำระเงินของแอป Gemini เท่านั้น โดยมีเงื่อนไขพื้นฐานดังต่อไปนี้

  • ต้องเป็นผู้ใช้ที่อายุ อย่างน้อย 18 ปี ตามนโยบายของ Google
  • ต้องสมัครใช้บริการ Gemini Premium หรือระดับสมาชิกที่ให้สิทธิ์การเข้าถึงฟีเจอร์ขั้นสูง
  • ต้องใช้แอป Gemini เวอร์ชันล่าสุดบนอุปกรณ์ที่รองรับการประมวลผลภาพและเสียง

Google ยังระบุว่าจะค่อยขยายการให้บริการให้ครอบคลุมผู้ใช้ระดับพื้นฐานในช่วงหลายเดือนข้างหน้า หากมีการตอบรับที่ดีและไม่มีปัญหาด้านความเป็นส่วนตัวหรือการใช้งานที่ผิดพลาด

Privacy & Ethical Concerns

แม้ว่าเทคโนโลยี Avatar จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ส่วนบุคคล แต่ก็ทำให้เกิดคำถามด้านความเป็นส่วนตัวและจริยธรรมอย่างชัดเจน การใช้ใบหน้าและเสียงของผู้ใช้เพื่อสร้างคลอนดิจิทัลอาจทำให้ข้อมูลชีวภาพถูกเก็บไว้ในระบบคลาวด์ของ Google ซึ่งอาจเป็นเป้าหมายของการโจมตีหรือการใช้งานโดยไม่ได้รับอนุญาต

Google พยายามบรรเทาความกังวลนี้ด้วยการฝัง SynthID watermark ที่ช่วยให้วิดีโอที่สร้างโดย AI สามารถแยกแยะได้จากวิดีโอที่ถ่ายทำจริง นอกจากนี้ยังมีการแจ้งเตือนผู้ใช้ให้ตรวจสอบและยืนยันการใช้ข้อมูลส่วนบุคคลก่อนทำการสร้าง Avatar อย่างไรก็ตาม ผู้สังเกตการณ์ด้านความปลอดภัยดิจิทัลยังคงเตือนว่าการเผยแพร่ Avatar ไปยังสื่อสาธารณะอาจทำให้เกิดการหลอกลวงหรือการปลอมแปลงตัวตนได้ง่ายขึ้น

Market Impact

การเปิดตัว Avatar อย่างกว้างขวางอาจเป็นสัญญาณบ่งชี้ถึงการเปลี่ยนแปลงในอุตสาหกรรมคอนเทนต์ดิจิทัล การใช้ AI สร้างตัวแทนเสมือนจริงอาจทำให้ครีเอเตอร์, นักการตลาด และผู้ผลิตสื่อสามารถลดต้นทุนการผลิตวิดีโอและเพิ่มความเร็วในการสร้างสรรค์คอนเทนต์ได้อย่างมีประสิทธิภาพ

ในมุมของการแข่งขัน ฟีเจอร์นี้ทำให้ Google แข่งกับแพลตฟอร์ม AI อื่น ๆ เช่น Meta’s LLaVA หรือ OpenAI’s Sora ที่กำลังพัฒนาเทคโนโลยีคล้ายคลึงกัน การที่ Google นำ Omni model มาใช้เป็นจุดเด่นในการประมวลผลหลายรูปแบบพร้อมกันอาจช่วยให้ Gemini ยังคงความได้เปรียบด้านความแม่นยำและความเป็นธรรมชาติของ Avatar

อย่างไรก็ตาม ความสำเร็จของฟีเจอร์นี้จะขึ้นกับการยอมรับของผู้ใช้และการจัดการความเสี่ยงด้านความเป็นส่วนตัว หากผู้ใช้รู้สึกว่าการใช้ Avatar มีความปลอดภัยและเป็นประโยชน์จริง ๆ การรับสมัครสมาชิกแบบชำระเงินอาจเพิ่มขึ้นอย่างต่อเนื่อง

Summary

Google ได้ขยายการให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni ให้กับสมาชิกชำระเงินในแอป Gemini อย่างเป็นทางการ ผู้ใช้สามารถสร้างคลอนดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยมี SynthID watermark ปกป้องความโปร่งใส การเปิดตัวนี้อาจส่งผลต่อรูปแบบการสร้างคอนเทนต์และการแข่งขันในตลาด AI อย่างต่อเนื่อง.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
Google’s wild Gemini tool that creates a talking, moving AI clone of you is now rolling out widely
ผู้เขียน
Adamya Sharma
แหล่ง
Android Authority
วันที่เผยแพร่
3 มิถุนายน 2569 เวลา 12:25

Related

บทความที่เกี่ยวข้อง

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…AI
15 มิถุนายน 2569 เวลา 21:30

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…

NotebookLM ยังคงเป็น AI ช่วยวิจัยยอดนิยม ด้วยอัปเดต UI การสรุปแม่นยำขึ้นและความเร็วในการจัดการข้อมูล การยกเลิกฟีเจอร์เสียงแม้เงียบแต่เปลี่ยนวิธีใช้มาก

XDA Developers6 นาที
เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…AI
15 มิถุนายน 2569 เวลา 17:00

เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…

การสร้าง prototype เป็นขั้นตอนสำคัญเพื่อให้ผู้จัดพิมพ์พิจารณาการลงทุน แต่การใช้ AI อย่างเร่งรีบอาจทำให้เกมสูญเสียเอกลักษณ์และความน่าเชื่อถือ ตามที่ผู้แทนจาก…

Rock Paper Shotgun7 นาที
สหรัฐอเมริกาบังคับ Anthropic ระงับโมเดล AI ชั้นนำทันทีAI
15 มิถุนายน 2569 เวลา 14:00

สหรัฐอเมริกาบังคับ Anthropic ระงับโมเดล AI ชั้นนำทันที

รัฐบาลสหรัฐออกคำสั่งฉุกเฉินให้ Anthropic ปิดให้บริการโมเดล AI Fable 5 และ Mythos 5 ทั้งหมด เนื่องจากความกังวลเรื่องความปลอดภัยระดับชาติและช่องโหว่ jailbreak…

Android Authority6 นาที
ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…AI
15 มิถุนายน 2569 เวลา 05:00

ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…

ผู้ใช้ให้ Local LLM เข้าถึง Docker เพื่อสร้างสคริปต์มอนิเตอร์อัตโนมัติ แต่ค่าใช้จ่ายสูง, ความเป็นส่วนตัวเสี่ยง, และผลลัพธ์ไม่แม่นยำ…

XDA Developers8 นาที
คัดลอกลิงก์แล้ว!