SCB 10X เปิดตัว "ไต้ฝุ่น" (Typhoon) โมเดลภาษาขนาดใหญ่ ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ พร้อมเปิดให้ทดลองใช้ Pretrained Model ฟรี

จันทร์ ๒๙ มกราคม ๒๕๖๗ ๑๐:๒๗
ชูจุดเด่นประสิทธิภาพเหนือกว่าโมเดลภาษาไทยขนาดใหญ่แบบโอเพ่นซอร์สทั้งหมด เทียบเท่ากับ GPT-3.5 ในภาษาไทยเปิดให้ได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model และเวอร์ชัน Instruction-tuned model ผ่าน API service อย่างไม่มีค่าใช้จ่าย เพื่อเพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทยเอสซีบี เท็นเอกซ์ (SCB 10X) บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) ล่าสุด เปิดตัว "ไต้ฝุ่น" (Typhoon) โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งนับเป็นโมเดลภาษาไทยขนาดใหญ่ที่ดีที่สุดในปัจจุบันและมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย โดย "ไต้ฝุ่น" (Typhoon) ถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language)
SCB 10X เปิดตัว ไต้ฝุ่น (Typhoon) โมเดลภาษาขนาดใหญ่ ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ พร้อมเปิดให้ทดลองใช้ Pretrained Model ฟรี

"ไต้ฝุ่น" (Typhoon) ถูกออกแบบและพัฒนาขึ้นมาเป็น 2 เวอร์ชั่น ได้แก่ 1. Pretrained Model ซึ่งเปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก และ 2. Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น ซึ่งผลการทดลองในชุดข้อสอบภาษาไทยแสดงให้เห็นว่า Typhoon มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ทั้งหมด และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย ซึ่งเป็นโมเดลที่อยู่เบื้องหลัง ChatGPT โดยมีพารามิเตอร์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย

โมเดลภาษาไทยขนาดใหญ่ ถือเป็นก้าวสำคัญในการพัฒนาโมเดลภาษา AI สำหรับภาษาไทย อีกทั้งยังเปิดโอกาสใหม่ ๆ สำหรับการใช้งานทางภาษาที่หลากหลาย ตอกย้ำความมุ่งมั่นของ SCB 10X ในการขับเคลื่อนและผลักดันความก้าวหน้าทางเทคโนโลยีให้กลุ่มเอสซีบี เอกซ์ (SCBX Group) มุ่งสู่เป้าหมายการเป็น AI-First Organization ควบคู่กับการสร้างธุรกิจใหม่ ๆ ผ่านการเป็นผู้ให้บริการด้านโซลูชันและเทคโนโลยีขั้นสูงอีกด้วย "ไต้ฝุ่น" (Typhoon) พร้อมเปิดให้ผู้สนใจและนักพัฒนาได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model ภายใต้ใบอนุญาต Apache 2.0 อย่างไม่มีค่าใช้จ่าย โดยสามารถดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b ซึ่งมีรายงานเชิงเทคนิคประกอบ สามารถอ่านเพิ่มเติมได้ที่ https://arxiv.org/abs/2312.13951 นอกจากนี้ผู้สนใจและนักพัฒนายังสามารถลงทะเบียนเพื่อรอทดลองใช้งานโมเดล Instruction-tuned เวอร์ชันเริ่มต้นในรูปแบบของ API ได้ในเร็วๆ นี้ ที่ https://opentyphoon.ai โดยมีจุดมุ่งหมายเพื่อการพัฒนาโมเดลภาษาไทยขนาดใหญ่ให้มีประสิทธิภาพและความก้าวหน้าเพิ่มขึ้น อีกทั้งเพื่อเพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทย

ที่มา: เอสซีบี เท็นเอกซ์

ข่าวประชาสัมพันธ์ล่าสุด

๒๗ เม.ย. อแมนด้า ชาร์ลีน ออบดัม VICHY LIFTACTIV BRAND PARTNER ตัวแทนประเทศไทย ร่วมงาน 'V.I.C VICHY INTEGRATIVE CENTER' อีเว้นท์สุดยิ่งใหญ่ในรอบ 5 ปี ของแบรนด์ VICHY (วิชี่) อวดลุคเซ็กซี่สุดฮอต สวย ปัง
๒๖ เม.ย. ไทยพีบีเอสผนึกกำลัง สสส. ผลิต และเผยแพร่เนื้อหาส่งเสริมสุขภาวะเด็ก เยาวชน และครอบครัว
๒๖ เม.ย. NPS ร่วมสืบสานประเพณีสงกรานต์ชุมชนในพื้นที่รอบโรงไฟฟ้า ประจำปี 2567
๒๖ เม.ย. แพทย์แผนไทย มทร.ธัญบุรี แนะฤดูร้อนควรทานพืชผักที่มีฤทธิ์เย็นช่วยลดความร้อนในร่างกาย
๒๖ เม.ย. แพรนด้า จัดประชุมสามัญผู้ถือหุ้น ประจำปี 2566
๒๖ เม.ย. RBRU Herb Shot ขยายศักยภาพทางธุรกิจ รุกตลาดอินเดีย
๒๖ เม.ย. ไฮเออร์ ประเทศไทย เดินเกมรุกไตรมาส 2 เปิดตัวตู้เย็นรุ่นใหม่ Multi-door HRF-MD679 ตั้งเป้าปี 67 ดันยอดขายตู้เย็นโต
๒๖ เม.ย. เอ็น.ซี.ซี.ฯ ประกาศจัดงาน PET EXPO THAILAND 2024 ระดมสินค้า บริการ ลดหนักจัดเต็ม รับกระแส Petsumer ดันตลาดสัตว์เลี้ยงโตแรง
๒๖ เม.ย. ธอส. ขานรับนโยบายรัฐบาล ลดอัตราดอกเบี้ย MRR 0.25% ต่อปี พร้อมส่งเสริมวินัยการออม ด้วย เงินฝากออมทรัพย์เก็บออม ดอกเบี้ยสูงถึง 1.95%
๒๖ เม.ย. ManageEngine ลดความซับซ้อน ช่วยองค์กรจัดการต้นทุนบนคลาวด์ทั่วมัลติคลาวด์ได้ง่ายขึ้น พร้อมรองรับแพลตฟอร์ม Google Cloud