Gemini – เทคโนโลยีใหม่ๆ ที่เกิดขึ้นบนโลกใบนี้ถือเป็นโอกาสอันยอดเยี่ยมของมวลมนุษยชาติในการสรรสร้างสิ่งใหม่ๆ ด้วยความช่วยเหลือของเทคโนโลยี โดยเฉพาะการมาถึงของ Generative AI เทคโนโลยีปัญญาประดิษฐ์สุดล้ำในช่วงไม่กี่ปีที่ผ่านมาที่สร้างแรงกระเพื่อมไปทั่วทุกวงการ ซึ่งนอกจาก Chat GPT ของ OpenAI แล้วยังมีอีกหนึ่งโมเดล AI ที่มาแรงอย่างเจมิไนน์จาก Google ที่เพิ่งเปิดตัวไปไม่นาน ที่เริ่มได้รับความนิยมเพิ่มขึ้นอย่างต่อเนื่อง ซึ่งวันนี้ Talka จะพาทุกคนมาทำความรู้จักกับโมเดล AI ตัวนี้ให้ดียิ่งขึ้นไปพร้อมกันครับ
Gemini คืออะไร?
ทำความเข้าใจ Gemini คืออะไร?
Gemini หรือเดิมใช้ชื่อว่า Bard เป็นเครื่องมือแชทบอท AI ที่เปิดตัวเมื่อวันที่ 6 ธันวาคม 2023 สร้างโดยหน่วยธุรกิจ Google DeepMind ของ Alphabet ซึ่งมุ่งเน้นการวิจัยและพัฒนา AI ขั้นสูง เพื่อจำลองการสนทนาของมนุษย์โดยใช้การประมวลผลภาษาธรรมชาติ (NLP) และการเรียนรู้ของเครื่อง (Machine Learning) นอกเหนือจากการเสริม Google Search แล้วเจมิไนน์ยังสามารถผนวกรวมเข้ากับเว็บไซต์ แพลตฟอร์มการรับส่งข้อความ หรือแอปพลิเคชันต่างๆ เพื่อให้การตอบคำถามของผู้ใช้เป็นภาษาที่สมจริงและเป็นธรรมชาติ โดยเจมิไนน์นั้นเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่ออกแบบมาให้มีประสิทธิภาพและความสามารถมากกว่าโมเดล AI รุ่นก่อนๆ ทำให้ใช้งานได้หลากหลายรูปแบบ (Multimodal)
โดยมีความสามารถในการทำความเข้าใจภาษา ข้อความ เสียง โค้ด รูปภาพ หรือแม้แต่วิดีโอ เจมิไนน์ สามารถประมวลผลข้อมูลประเภทต่างๆ และรวมเข้าด้วยกันเพื่อทำงานที่ซับซ้อนได้ ลองจินตนาการถึงโมเดล AI เดียวที่สามารถนำทางข้อความ โค้ด เสียง รูปภาพ และวิดีโอได้อย่างราบรื่น การสร้างสรรค์ที่ปฏิวัติวงการนี้เป็น AI ที่มีความสามารถมากที่สุดของ Google ซึ่งออกแบบมาสำหรับ
- ความหลากหลาย : การทำความเข้าใจและการทำงานกับข้อมูลประเภทต่างๆ ส่งเสริมการโต้ตอบที่เป็นธรรมชาติและหลากหลายมากขึ้น
- ความยืดหยุ่น : ทำงานอย่างมีประสิทธิภาพบนแพลตฟอร์มที่หลากหลาย ตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์มือถือของคุณ ทำให้เข้าถึง AI ได้มากขึ้น
- ความสามารถในการแก้ไขปัญหา : Gemini 1.0 Ultra สามารถเอาชนะผู้เชี่ยวชาญที่เป็นมนุษย์ในเกณฑ์มาตรฐาน MMLU หรือความเข้าใจในภาษา โดยแสดงให้เห็นถึงความสามารถที่โดดเด่นเหนือมนุษย์
Google แบ่ง เจมิไนน์ ออกเป็น 3 เวอร์ชัน ที่ได้รับการออกแบบมาให้ทำงานบนอุปกรณ์เกือบทุกชนิด Google อ้างว่าทั้งสามเวอร์ชัน ได้แก่ Ultra, Pro และ Nano สามารถทำงานได้อย่างมีประสิทธิภาพกับทุกสิ่งตั้งแต่ในศูนย์ข้อมูลไปจนถึงบนสมาร์ทโฟน
- Ultra
Google ระบุว่านี่เป็นโมเดลที่ “ใหญ่ที่สุด” และ “มีความสามารถมากที่สุด” สำหรับการทำงานที่มีความซับซ้อนสูง Google กล่าวว่า Gemini มีประสิทธิภาพเหนือกว่า GPT-4 ในเกณฑ์มาตรฐานทางวิชาการส่วนใหญ่ที่ใช้มากที่สุดในการวิจัยและพัฒนา LLM รวมถึงงานต่อเนื่องหลายรูปแบบต่างๆ โมเดลดังกล่าวกำลังรวมอยู่ในผลิตภัณฑ์ยอดนิยมหลายรายการของ Google รวมถึง Gmail, Doc, Slide และ Meet ผู้ใช้สามารถเข้าถึง เวอร์ชัน Ultra ในราคา $19.99 ต่อเดือนผ่านบริการ Gemini Advanced
- Pro
เวอร์ชัน pro เป็นโมเดลระดับกลางที่ออกแบบมาเพื่อทำความเข้าใจคำถามที่ซับซ้อนและตอบกลับอย่างรวดเร็ว ทำให้เป็นโมเดลที่ดีที่สุดสำหรับ “การปรับขนาดในงานที่หลากหลาย” ตามที่ Google กล่าวไว้ ขณะนี้ Pro เวอร์ชันที่ได้รับการฝึกอบรมมาเป็นพิเศษกำลังขับเคลื่อนแชทบอท เจมิไนน์ และพร้อมใช้งานผ่าน Gemini API ใน Google AI Studio และ Google Cloud Vertex AI
- Nano
เวอร์ชัน Nano ซึ่งเป็นเวอร์ชันที่เล็กกว่ารุ่น Pro และ Ultra ได้รับการออกแบบมาให้มีประสิทธิภาพเพียงพอที่จะทำงานบนอุปกรณ์อัจฉริยะโดยตรง แทนที่จะต้องเชื่อมต่อกับเซิร์ฟเวอร์ภายนอก ปัจจุบัน Nano ขับเคลื่อนฟีเจอร์ต่างๆ บนสมาร์ทโฟน Google Pixel 8 Pro เช่น สรุปในแอป Recorder และ Smart Reply ในแอปแป้นพิมพ์เสมือนอย่าง Gboard เป็นต้น
Gemini แตกต่างจากโมเดล AI อื่นอย่างไร
เจมิไนน์ แตกต่างจากโมเดล AI อื่นๆ อย่างไร
ฟีเจอร์หลักที่โดดเด่นของ Gemini
ฟีเจอร์หลักที่โดดเด่นของเจมิไนน์
1. ความสามารถหลายรูปแบบ (Multimodal Capabilities)
2. ความสามารถในการเขียนโค้ดขั้นสูง
3. ตอบโจทย์ความต้องการที่แตกต่างกัน
4. การใช้งานจริง
5. บูรณาการกับบริการของ Google
6. ประสิทธิภาพที่น่าพอใจ