อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

พุธ ๓๐ เมษายน ๒๕๖๘ ๑๕:๔๔
อาลีบาบา สร้างมาตรฐานใหม่ให้กับนวัตกรรมด้าน AI เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์สของบริษัทฯ
อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

ซีรีส์ Qwen3 ประกอบด้วยหก dense model และสอง Mixture-of-Experts (MoE) model ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชันยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมายได้อย่างยืดหยุ่นโมเดล Qwen3 ทั้งหมด ปัจจุบันเปิดเป็นโอเพ่นซอร์สทั่วโลก ซึ่งรวมถึง dense models (ขนาดพารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B, และ 32B) และ MoE models (30B with 3B active, และ 235B with 22B active)

โมเดลการใช้เหตุผลแบบผสมผสาน (hybrid reasoning models) คือการผสานรวมโหมดการคิดเป็นขั้นเป็นตอน (thinking mode) และโหมดการใช้สัญชาตญาณ (non-thinking mode) ไว้ด้วยกัน

Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา เป็นการรวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โมเดล Qwen3 สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ non-thinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์อื่นทั่ว ๆ ไป

นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่างการดำเนินงานที่ชาญฉลาดและประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ เป็นการย้ำให้เห็นความมุ่งมั่นของอาลีบาบาที่มุ่งสร้าง AI สมรรถนะสูงที่ให้ทุกคนเข้าใช้งานได้

ความก้าวหน้าครั้งสำคัญด้านทักษะหลายภาษา, ความสามารถของเอเจนต์, การใช้เหตุผล และความสอดคล้องทางความคิดและพฤติกรรมของมนุษย์

Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึงสองเท่า จึงมีประสิทธิภาพล้ำหน้าอย่างมากทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา

ความสามารถสำคัญ ๆ ได้แก่

  • เชี่ยวชาญหลายภาษา: รองรับ 119 ภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งได้หลายภาษาด้วยประสิทธิภาพสูง
  • สามารถผสานรวมเอเจนต์ประสิทธิภาพสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันหรือการเรียกใช้เครื่องมือที่ทรงประสิทธิภาพ นับเป็นโมเดลโอเพ่นซอร์สระดับแนวหน้าเพื่องานที่ต้องใช้เอเจนต์ที่ซับซ้อน
  • มีการใช้เหตุผลที่เหนือกว่า: เหนือกว่าโมเดล Qwen รุ่นก่อนหน้านี้ (QwQ ใช้ thinking mode และ Qwen2.5 ใช้ non-thinking mode) ในด้านการวัดประสิทธิภาพทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
  • สอดคล้องกับความคิดและพฤติกรรมของมนุษย์มากขึ้น: สามารถมอบการเขียนเชิงสร้างสรรค์ การแสดงบทบาทสมมติ และการสนทนาโต้ตอบไปมา เพื่อทำให้การสนทนาเป็นธรรมชาติและน่าสนใจมากขึ้น

ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้)

นอกจากนี้ ได้มีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start), การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning: RL), การผสานผสาน thinking mode (thinking mode fusion) และ การเรียนรู้แบบเสริมแรงทั่วไป (general RL)

เปิดให้เข้าถึงเพื่อขับเคลื่อนนวัตกรรม

โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging Face, Github, ModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของอาลีบาบาจะเปิดให้เข้าใช้ได้เร็ว ๆ นี้ นอกจากนี้ Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชันผู้ช่วยอัจฉริยะ AI สำคัญของอาลีบาบาอีกด้วย

นับแต่เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งใน ซีรีส์โมเดล open-source AI ที่มีการนำไปใช้อย่างแพร่หลายที่สุดในโลก

ที่มา: FAQ

ข่าวประชาสัมพันธ์ล่าสุด

๑๘:๓๓ COM7 เดินหน้าเต็มสปีด EV7 ส่งมอบแท็กซี่ไฟฟ้าล็อตแรก ดันเมกะเทรนด์ EV สู่หัวใจเมือง
๑๘:๓๖ GCAP ประชุมสามัญผู้ถือหุ้นประจำปี 2568 ไฟเขียวผ่านฉลุยทุกวาระ พร้อมเดินหน้าแผนธุรกิจขยายสู่กลยุทธ์ Non Lending
๑๘:๔๔ PYLON จัดประชุมสามัญผู้ถือหุ้นประจำปี 2568 ผู้ถือหุ้นไฟเขียวจ่ายปันผล 0.04 บาท/หุ้น
๑๘:๓๙ LDC จัดประชุมสามัญผู้ถือหุ้น ประจำปี 2568 มุ่งเป็นคลินิกทันตกรรมพรีเมียม ในราคาที่เข้าถึงง่าย
๑๘:๑๒ ผู้ถือหุ้น TATG ไฟเขียวจ่ายปันผล 0.07 บาท/หุ้น ลงทุนเครื่องจักรใหม่เสริมแกร่งสายการผลิต พิชิตเป้ารายได้ 3,000
๑๘:๕๗ ADVICE จัดประชุมสามัญผู้ถือหุ้นรูปแบบ Hybrid ประจำปี 2568 ผถห.ไฟเขียวทุกวาระ เคาะแจกปันผล 0.175 บ./หุ้น
๑๘:๓๖ LE ร่วมงานสถาปนิก'68 โชว์นวัตกรรมแสงสว่างอัจฉริยะ เสริมภาพผู้นำ Lighting Solutions Provider
๑๘:๔๖ SELIC จัดประชุมสามัญผู้ถือหุ้น ปี 2568 ผู้ถือหุ้นเห็นชอบทุกวาระ อนุมัติจ่ายปันผล 0.038 บาท/หุ้น เดินหน้า 3 ธุรกิจ
๑๘:๔๙ STA เปิดบ้านต้อนรับภาครัฐ โชว์มาตรฐานรับซื้อยางโปร่งใส เป็นธรรม หนุนรัฐต้านยางเถื่อน
๑๘:๓๕ กรมพัฒนาฝีมือแรงงาน จับมือเอกชน ปั้นช่างเชื่อมโกอินเตอร์ รายได้ทะลุ 70,000 บาทต่อเดือน