Google I/O 2024: Gemini AI, Project Astra, Android 15

Google I/O 2024: อัปเดตเทคโนโลยีใหม่จาก Google

ในงาน Google I/O ประจำปี 2024 ที่จัดขึ้นที่ Shoreline Amphitheater ใน Mountain View, Sundar Pichai ซีอีโอของ Google ได้กล่าวว่า “AI” จำนวน 121 ครั้งในช่วงสองชั่วโมงของการบรรยายหลัก นี่เป็นสิ่งที่สรุปได้จากการพยายามนำ AI เข้าสู่ทุกแอปและบริการของ Google ที่ใช้งานโดยผู้คนกว่าสองพันล้านคนทั่วโลก นี่คือการอัปเดตหลักที่ Google ประกาศในงานนี้

Gemini 1.5 Flash และการอัปเดต Gemini 1.5 Pro

Google ได้เปิดตัวโมเดล AI ใหม่ชื่อว่า Gemini 1.5 Flash ซึ่งถูกออกแบบมาให้รวดเร็วและมีประสิทธิภาพ Flash อยู่ระหว่าง Gemini 1.5 Pro และ Gemini 1.5 Nano ซึ่งเป็นโมเดลที่เล็กที่สุดของบริษัทที่ทำงานในเครื่อง Google สร้าง Flash เพื่อตอบสนองความต้องการของนักพัฒนาที่ต้องการโมเดลที่เบาและถูกกว่า Gemini Pro แต่ยังคงมีคุณสมบัติเฉพาะเช่นหน้าต่างบริบทยาวหนึ่งล้านโทเคนที่จะเพิ่มขึ้นเป็นสองล้านโทเคนในปลายปีนี้ ซึ่งหมายความว่ามันสามารถประมวลผลวิดีโอได้สองชั่วโมง, เสียง 22 ชั่วโมง, โค้ดมากกว่า 60,000 บรรทัด หรือคำมากกว่า 1.4 ล้านคำในเวลาเดียวกัน

Project Astra

Google ได้แสดง Project Astra ซึ่งเป็นผู้ช่วยอเนกประสงค์ที่ขับเคลื่อนด้วย AI ที่ Demis Hassabis ซีอีโอของ DeepMind กล่าวว่าเป็น “ตัวแทน AI ของ Google ที่สามารถช่วยในชีวิตประจำวันได้”

ในวิดีโอที่ Google บอกว่าถ่ายทำในครั้งเดียว ผู้ใช้ Astra เดินรอบสำนักงาน Google ในลอนดอนพร้อมกับถือโทรศัพท์และชี้กล้องไปที่สิ่งต่าง ๆ เช่น ลำโพง โค้ดบนกระดานไวท์บอร์ด และมองออกนอกหน้าต่างและมีการสนทนาธรรมชาติกับแอปเกี่ยวกับสิ่งที่เห็น ในช่วงเวลาที่น่าประทับใจที่สุดวิดีโอบอกให้ผู้ใช้รู้ว่าแว่นตาของเธออยู่ที่ไหนโดยที่ผู้ใช้ไม่ต้องกล่าวถึงแว่นตาเลย

วิดีโอจบลงด้วยการพลิกโผ เมื่อผู้ใช้พบและสวมแว่นตาที่หายไป เราได้รู้ว่าแว่นตานั้นมีระบบกล้องในตัวและสามารถใช้ Project Astra ในการสนทนาอย่างต่อเนื่องกับผู้ใช้ ซึ่งอาจบ่งบอกว่า Google กำลังทำงานกับคู่แข่งของแว่นตาอัจฉริยะ Ray Ban ของ Meta

Ask Google Photos

Google Photos ได้รับการยกระดับด้วย AI โดยจะเพิ่มความสามารถในการค้นหาภาพหรือวิดีโอที่เฉพาะเจาะจง สำหรับผู้ใช้ Google One ในสหรัฐอเมริกา คุณจะสามารถถาม Google Photos คำถามซับซ้อนเช่น “แสดงรูปภาพที่ดีที่สุดจากแต่ละอุทยานแห่งชาติที่ฉันเคยไป” Google Photos จะใช้ข้อมูล GPS และการตัดสินของตัวเองว่าอะไรคือ “ดีที่สุด” เพื่อแสดงตัวเลือกให้คุณ นอกจากนี้คุณยังสามารถขอให้ Google Photos สร้างคำบรรยายเพื่อโพสต์ภาพลงบนโซเชียลมีเดียได้อีกด้วย

Veo และ Imagen 3

เครื่องมือสร้างสื่อที่ขับเคลื่อนด้วย AI ใหม่ของ Google คือ Veo และ Imagen 3 Veo เป็นคำตอบของ Google ต่อ OpenAI’s Sora มันสามารถผลิตวิดีโอคุณภาพสูง 1080p ที่มีความยาวเกินกว่าหนึ่งนาทีได้ และสามารถเข้าใจแนวคิดทางภาพยนตร์เช่นการเร่งเวลา

ในขณะเดียวกัน Imagen 3 เป็นเครื่องสร้างภาพจากข้อความที่ Google อ้างว่าจัดการข้อความได้ดีกว่าเวอร์ชันก่อนหน้า Imagen 2 ผลลัพธ์คือโมเดลสร้างภาพจากข้อความที่มีคุณภาพสูงสุดของบริษัทด้วยรายละเอียดที่น่าทึ่งสำหรับภาพที่เหมือนจริงและมีข้อบกพร่องน้อยลง ซึ่งแทบจะเป็นคู่แข่งกับ DALLE-3 ของ OpenAI

การอัปเดตครั้งใหญ่ใน Google Search

Google กำลังทำการเปลี่ยนแปลงครั้งใหญ่กับการทำงานของการค้นหา อัปเดตส่วนใหญ่ที่ประกาศในวันนี้เช่นความสามารถในการถามคำถามที่ซับซ้อนมาก (“ค้นหาสตูดิโอโยคะหรือพิลาทิสที่ดีที่สุดในบอสตันและแสดงรายละเอียดเกี่ยวกับข้อเสนอเบื้องต้นและเวลาเดินจาก Beacon Hill”) และการใช้การค้นหาเพื่อวางแผนมื้ออาหารและการท่องเที่ยวจะไม่สามารถใช้ได้เว้นแต่คุณจะเข้าร่วมใน Search Labs ซึ่งเป็นแพลตฟอร์มของบริษัทที่ให้ผู้คนลองใช้คุณสมบัติทดลอง

แต่ฟีเจอร์ใหม่ที่ใหญ่ที่เรียกว่า AI Overviews ที่บริษัทได้ทดสอบมาเป็นปีจะเริ่มเปิดตัวให้กับผู้คนหลายล้านคนในสหรัฐอเมริกา Google Search จะนำเสนอคำตอบที่สร้างโดย AI ที่ด้านบนของผลลัพธ์โดยอัตโนมัติและบริษัทกล่าวว่าจะนำฟีเจอร์นี้ให้กับผู้ใช้กว่าพันล้านคนทั่วโลกภายในสิ้นปีนี้

Gemini บน Android

Google กำลังผสาน Gemini เข้ากับ Android โดยตรง เมื่อ Android 15 เปิดตัวในปลายปีนี้ Gemini จะสามารถรับรู้แอป รูปภาพหรือวิดีโอที่คุณกำลังใช้งาน และคุณจะสามารถเปิดมันขึ้นมาเป็นหน้าต่างซ้อนทับและถามคำถามตามบริบทได้ ที่จะทิ้ง Google Assistant ไว้ที่ไหน? ไม่มีใครรู้! Google ไม่ได้นำมันขึ้นมาในบรรยายหลักวันนี้เลย

ยังมีการอัปเดตอื่น ๆ อีกมากมาย Google กล่าวว่าจะเพิ่มลายน้ำดิจิทัลให้กับวิดีโอและข้อความที่สร้างโดย AI ทำให้ Gemini เข้าถึงได้ในแผงข้างใน Gmail และ Docs ขับเคลื่อนเพื่อนร่วมทีมเสมือนใน Workspace ฟังการโทรศัพท์และตรวจจับว่าคุณกำลังถูกหลอกลวงแบบเรียลไทม์ และอีกมากมาย

สรุป

การประกาศจากงาน Google I/O 2024 แสดงให้เห็นถึงความมุ่งมั่นของ Google ในการพัฒนาและนำ AI มาใช้ในทุกๆ ด้านของบริการและผลิตภัณฑ์ของพวกเขา ด้วยการอัปเดตที่สำคัญมากมาย รวมถึงการเปิดตัวของโมเดล AI ใหม่ โครงการผู้ช่วยอัจฉริยะ และการปรับปรุงการค้นหา Google ยังคงนำเสนอเทคโนโลยีที่ก้าวหน้าเพื่อปรับปรุงประสบการณ์ของผู้ใช้และการทำงานประจำวันในรูปแบบใหม่

Source