Lionel Lam, Senior Solutions Architect, Red Hat Inc. บรรยายในหัวข้อ Sustainable Cloud Storage Solution ได้กล่าวว่า ข้อมูล Social บน Internet เป็นปัจจัยสำคัญทำให้เกิดการขยายตัวของข้อมูลอย่างมหาศาล ส่งผลให้เกิดความต้องการพื้นที่ขนาดใหญ่ในการจัดเก็บข้อมูล สามารถเข้าถึงได้ทุกที่ทุกเวลา และยังต้องคำนึงถึงการดูแลรักษาข้อมูลไม่ให้สูญหาย การเกิดของ Cloud ทำให้ Storage ที่ใช้ในการจัดเก็บต้องมีความยืดหยุ่นในการจัดเก็บข้อมูล จึงเกิดแนวคิดใหม่ที่เรียกว่า Software Defined Storage ซึ่งเป็นแนวคิดของการเอา Software มาครอบ Storage หรือ Disk แล้วบริหารจัดการผ่าน Software โดยไม่มีข้อจำกัดทางยี่ห้อ Hardware อีกต่อไป Software Defined Storage จะมีการพัฒนาอย่างยั่งยืนต้องคำนึงถึง 1. On demand Provisioning of Storage : จัดเตรียมพื้นที่จัดเก็บข้อมูลตามพื้นที่การใช้งาน ไม่ต้องเผื่อพื้นที่ 2. Deployment Flexibility : มีความยืดหยุ่นในการติดตั้ง ไม่มีข้อจำกัดทางยี่ห้อ Hardware 3. Multi-tenancy สามารถให้บริการ/แบ่งทรัพยากรไปให้ผู้ใช้จำนวนมาก ทางบริษัท Red Hat กล่าวว่าเทคโนโลยี "Ceph Storage" สามารถนำไปใช้ในด้าน 1. Analytics 2. Cloud Infrastructure 3. Rich Media & Archival 4. Sync & Share 5. Enterprise Virtualization
คุณวนพงษ์ แก้วสิงห์, Senior Information Technology Officer, GISTDA - สำนักงานพัฒนาเทคโนโลยีอวกาศและภูมิสารสนเทศ (องค์การมหาชน) บรรยายในหัวข้อ How We Choose Storage for GISTDA ได้มาแบ่งปันประสบการณ์เรื่องการติดตั้ง Ceph Storage GISTDA เป็นหน่วยงานรัฐที่บริการข้อมูลภูมิสารสนเทศ และวิจัยและพัฒนาเทคโนโลยีอวกาศของประเทศไทย จึงมีความจำเป็นต้องการแหล่งจัดเก็บสำหรับ 1. ข้อมูลภาพถ่ายดาวเทียม 25 ดวง 2. ข้อมูลจากระบบ Coastal Radar 3. ข้อมูลจาก Sensor วัดระดับน้ำ ปัญหาของ GISTDA คือ การลงทุน Storage มีราคาสูง, Storage มีปัญหาระบบเกิด Downtime เจ้าหน้าที่ไม่สามารถแก้ไขเองได้ ต้องรอ Vendor เข้ามาดำเนินการ ต้องรออะไหล่ จากต่างประเทศ, ค่า Maintenance มีค่าใช้จ่ายสูงและเพิ่มขึ้นทุกปี, ปัจจุบันถูกบังคับให้ Upgrade ทั้งระบบเพราะมีแนวโน้มหยุดการผลิตอะไหล่รุ่นเก่า และนโยบายผู้บริหารให้มีการปรับลดค่า Maintenance ทาง GISTDA จึงตัดสินใจเลือก CephFS สำหรับ Share File System ดังนี้ 1. Mant CephFS 2. Use Samba 3. Authentication with GISTDA Active Directory ก่อนหน้าที่จะใช้ CephFS ทาง GISTDA ใช้ NAS+SAN Storage อยู่
คุณกิตติรักษ์ ม่วงมิ่งสุข, Chairman: Open Source Education and Development Association (OSEDA) บรรยายในหัวข้อ Big Data Hadoop and SPARK Technology Review ได้กล่าวว่า Big Data คือ ปริมาณข้อมูลที่มีขนาดใหญ่มหาศาลเกินกว่าขีดความสามารถในการประมวลผลของระบบฐานข้อมูลธรรมดาจะรองรับได้Big Data มีคุณลักษณะ 3 Vs : Volumn ข้อมูลจะต้องเยอะ, Velocity ข้อมูลจะต้องโตเร็ว, Variety ข้อมูลจะต้องมีหลากหลายรูปแบบทั้งที่เป็นแบบโครงสร้าง ไม่เป็นโครงสร้างหรือรูปแบบที่ไม่แน่นอน ซอฟต์แวร์ที่มีการนำมาใช้กันมากในระบบ Big data คือ Hadoop เพราะ Hadoop เป็น Open Source Technology พัฒนาขึ้นด้วยภาษา Java ที่จะทำหน้าที่เป็น Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่เป็น Unstructure และนำมาประมวลผลได้ องค์ประกอบหลักๆของ Hadoop จะประกอบด้วย Hadoop Distributed File System (HDFS) และ MapReduce ใช้สำหรับประมวลผลข้อมูลที่มีขนาดใหญ่บน cluster Tool ที่เป็นที่นิยมอีกตัวหนึ่งคือ Spark เป็น tool สำหรับทำ Data Processing จุดขายของ Spark อยู่ที่ความเร็วในการประมวลผล (ประมวลผลใน memory ซึ่งเร็วกว่า cpu) เร็วกว่า MapReduce ของ Hadoop ได้ถึง 10 เท่า Spark ประกอบไปด้วยส่วนประกอบสี่ส่วน คือ 1. Spark SQL 2. Spark Streaming (การโอน ย้ายข้อมูล stream) 3. MLib (สำหรับทำ Machine Learning) 4. GraphX
สำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ องค์การมหาชน (SIPA) โดยคุณศิระ นกยูงทอง นักเทคโนโลยีสารสนเทศ ได้กล่าวว่า Storage นั้นมีความสำคัญ ไม่ว่าจะเป็น Ceph หรือ Hadoop ซึ่งเป็นหัวข้อการบรรยายในการสัมมนาครั้งนี้ การตัดสินใจเลือกใช้ Storage สำหรับการจัดเก็บข้อมูล และประมวลผลข้อมูล ควรตัดสินใจเลือกให้ตรงกับการใช้งาน และเหมาะสมกับหน่วยงานหรือองค์กรของท่าน
ท่านที่สนใจงาน SIPA Technology Meetup สามารถติดตามได้ที่ www.sipatechmeetup.com หรือ www.facebook.com/sipatechmeetup