OpenAI เพิ่มขีดความสามารถ ChatGPT วิเคราะห์รูปภาพ ฟังเสียง และคุยโต้ตอบได้

OpenAI เพิ่มขีดความสามารถ ChatGPT วิเคราะห์รูปภาพ ฟังเสียง และคุยโต้ตอบได้


OpenAI เพิ่มฟีเจอร์ให้ ChatGPT กับความสามารถใหม่ด้านเสียงและรูปภาพใน ChatGPT พร้อมอินเทอร์เฟซรูปแบบใหม่ที่ใช้งานง่ายยิ่งขึ้น

เสียงและรูปภาพช่วยให้ใช้ ChatGPT ในชีวิตได้มากขึ้น เช่น ถ่ายภาพสถานที่สำคัญขณะเดินทางและสนทนาเกี่ยวกับสิ่งที่น่าสนใจเกี่ยวกับสถานที่นั้น หรือเมื่อถึงบ้าน ถ่ายรูปตู้เย็นและตู้กับข้าวเพื่อดูว่ามื้อเย็นมีอะไรกินบ้าง และเราสามารถถามคำถามเพื่อดูสูตรอาหารได้ หลังอาหารเย็น ช่วยลูกของคุณแก้โจทย์คณิตศาสตร์โดยถ่ายรูปชุดโจทย์ได้

      

OpenAI จะเปิดตัวเสียงและรูปภาพใน ChatGPT ให้กับผู้ใช้ Plus และ Enterprise ในอีกสองสัปดาห์ข้างหน้า Voice กำลังจะมาใน iOS และ Android (เลือกใช้การตั้งค่าของคุณ) และรูปภาพจะพร้อมใช้งานในทุกแพลตฟอร์ม

ความสามารถด้านเสียงใหม่ขับเคลื่อนโดยโมเดลการอ่านออกเสียงข้อความแบบใหม่ ซึ่งสามารถสร้างเสียงที่เหมือนมนุษย์จากเพียงข้อความและคำพูดตัวอย่างเพียงไม่กี่วินาที โดย OpenAI ได้ร่วมมือกับนักพากย์มืออาชีพเพื่อสร้างเสียงแต่ละเสียง โดยใช้ Whisper ซึ่งเป็นระบบรู้จำคำพูดแบบโอเพ่นซอร์สเพื่อถอดเสียงคำพูดของคุณเป็นข้อความ

OpenAI เคยประกาศตั้งแต่ตอนเปิดตัว GPT-4 ว่ารองรับอินพุตเป็นภาพ ตอนนี้ก็เปิดโหมด multimodal ให้ใช้งานทั้ง GPT-3.5 และ GPT-4 (เรียกว่า GPT-4V) ฟีเจอร์นี้อ่านภาพได้หลากหลาย ตั้งแต่ภาพถ่ายปกติ จนถึงเอกสารที่มีภาพและข้อความประกอบกัน

ฟีเจอร์ทั้งสองส่วนทำให้สามารถใช้งานได้หลากหลายขึ้นมาก เช่น การแปลงคำพูดจากเสียงโดยตรงออกมาเป็นคำแปล หรือการใช้งานในแอป Be My Eyes ให้ ChatGPT มองภาพและบรรยายภาพที่เห็นออกมาเป็นเสียงให้กับผู้ที่มีการมองเห็นได้จำกัด

หากต้องการเริ่มต้นใช้งานด้วยเสียง ให้ไปที่การตั้งค่า → คุณสมบัติใหม่บนแอปมือถือ และเลือกใช้การสนทนาด้วยเสียง จากนั้นแตะปุ่มหูฟังที่มุมขวาบนของหน้าจอหลักแล้วเลือกเสียงที่คุณต้องการได้ถึง 5 เสียง

 

ที่มา - OpenAI , blognone


Shutterstock เปิดตัวฟีเจอร์แก้ไขรูปภาพด้วย AI ในคลังกว่า 750 ล้านภาพ
Shutterstock เป็นเว็บไซต์ที่ให้บริการซื้อภาพถ่าย, ภาพประกอบ, วิดีโอ, และเนื้อหาสื่อต่าง ๆ สำหรับการใช้ในการออกแบบกราฟิก, การพิมพ์, การสร้างเว็บไซต์,...
เกาหลีใต้วางแผนที่จะเปิดตัวเครือข่าย 6G แห่งแรกในปี 2571
เกาหลีใต้ประกาศเมื่อวันจันทร์ว่ามีแผนที่จะเปิดตัวเครือข่ายรุ่นที่ 6 (6G) ในปี 2571 โดยเป็นส่วนหนึ่งของแผน K-Network 2030เกาหลีใต้จะรักษาความปลอดภั...
ผู้สร้าง Gmail กล่าวว่า AI สามารถขัดขวางธุรกิจของ Google ได้ภายใน 2 ปี
เทรนด์ด้านเทคโนโลยีที่ยิ่งใหญ่ที่สุดในช่วงไม่กี่เดือนที่ผ่านมาคือการเพิ่มขึ้นของChatGPTเครื่องมือ AI ที่สร้างโดย OpenAI เปิดตัวเมื่อปลายปี 2565 แล...

Quote

Line

Call