|
เป็นระยะเวลากว่า 5 ปี ของการทำงานวิจัย โดยหน่วยงานเล็กแห่งหนึ่งที่ชื่อว่า หน่วยวิจัยภาษาศาสตร์และคำนวณ หรือ ทีซีแอล (TCL: Thai Computational Linguistics Laboratory) ของศูนย์วิจัยเอ็นไอซีทีแห่งเอเชีย (NICT Asia Research Center) ที่อยู่ภายใต้การกับกับดูแล โดยสถาบันเทคโนโลยีสารสนเทศและการสื่อสารแห่งประเทศญี่ปุ่น หรือ National Institute of Information and Communications Technology: NICT ที่เป็นหน่วยงานมุ่งเน้นการวิจัยเทคโนโลยีไอซีที
ทั้งนี้ตลอด 5 ปีหน่วยวิจัยภาษาศาสตร์และคำนวณ ได้ดำเนินการและสนับสนุนการวิจัยและพัฒนาเทคโนโลยี การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เพื่อให้มนุษย์สามารถสื่อสารกับคอมพิวเตอร์ หรือกับมนุษย์ด้วยกันได้ด้วยภาษาของตนเอง เช่น เทคโนโลยีคลังข้อมูล พจนานุกรมอิเล็กทรอนิกส์ เทคโนโลยีระบบแปลภาษา และระบบสืบค้นข้อมูล เป็นต้น
ด้วยความก้าวหน้าของเทคโนโลยีการประมวลผลธรรมชาตินี้ จะช่วยลดปัญหาเรื่อง พรมแดนภาษา (Language Barrier) และช่วงว่างในการเข้าถึง สารสนเทศและความรู้ (Digital divide) ทำให้มนุษย์สื่อสารข้ามภาษากันได้ด้วยภาษาของตัวเอง รวมถึงมีโอกาสและศักยภาพในการเข้าถึงข้อมูลข่าวสารบนอินเทอร์เน็ตได้แบบเท่าเทียม และในโอกาสที่ครบรอบ 5 ปีของการดำเนินการ ทีซีแอลจึงได้นำเสนอผลงานการสร้างเครือข่ายระบบสถาปนาองค์ความรู้ ที่เป็นการต่อยอดจาก ระบบสถาปนาองค์ความรู้ (Knowledge Unifying Initiator: KUI) หรือ คุย สำหรับการพัฒนาเครือข่ายทางสังคมสำหรับนักวิจัยภายใต้ โครงการศูนย์วิทยาศาสตร์และเทคโนโลยี (STKC) อันจะนำไปสู่การพัฒนาเพื่อประยุกต์ คุย ในรูปแบบอื่นๆ
ดร.วิรัช ศรเลิศล้ำวาณิช ผู้อำนวยการ ทีซีแอล อธิบายถึงตัวระบบ คุย ว่า ระบบสถาปนาองค์ความรู้ เป็นระบบพัฒนาฐานความรู้ออนไลน์แบบเปิด (โอเพนซอร์ส) เพื่อให้สมาชิกใช้เป็นเครื่องมือสร้าง-รวบรวมความรู้ตามกระบวนการทางความคิดของมนุษย์ คือ เริ่มจากความคิดเห็นเรื่องใดเรื่องหนึ่ง เสนอความคิดเห็นนั้น แลกเปลี่ยนทรรศนะในชุมชน ทำความเข้าใจและแปลภาษาต่างประเทศเป็นภาษาไทย ทำประชาพิจารณ์ และลงประชามติในประเด็นนั้นๆ ด้วยการลงคะแนน เป็นการสร้างชุมชนความรู้ออนไลน์ ที่ผู้ใช้อินเทอร์เน็ตสามารถมีส่วนร่วมในการสร้างองค์ความรู้ได้กว้างขวาง ทุกเวลา เท่าเทียม และทั่วถึง
ผู้อำนวยการ ทีซีแอล อธิบายต่อว่า เมื่อดูการทำงานแบบนี้อาจจะคิดว่าเหมือนวิกิพีเดีย หรือสารานุกรมออนไลน์ที่เปิดให้ทุกคนเข้าไปโพสเนื้อหาได้ แต่ที่จริงไม่เหมือนกันและ คุย มีความน่าเชื่อถือมากว่า เพราะในกระบวนการแปลภาษา จะเป็นการแลกเปลี่ยนความรู้ระหว่างกัน เช่น ชุมชนแปลข้อมูล คำถามระหว่างแพทย์-คนไข้ ชุมชนสร้าง Asian WordNet ที่มีฐานข้อมูลคำศัพท์กว่า 2 แสนคำ รวมถึงชุมชนสร้างฐานข้อมูลคำศัพท์ไทย-ญี่ปุ่น โดยนักวิจัยที่เข้ามาแลกเปลี่ยนความเห็น และแบ่งปันข้อมูลจะได้รับการจัดเรตติ้งความน่าเชื่อถือจากประวัติการทำงาน และการยอมรับของคนในชุมชน
ดร.วิรัช อธิบายถึง Asian WordNet ว่า มาจากปรัชญาการสื่อสารของคน ด้วยการนำเอาความหมายของศัพท์มาเปรียบเทียบกับ คำแตกต่าง คำตรงกันข้าม คำพ้องเสียง และอื่นๆ รวม 7 ความสัมพันธ์ เหมือนกับการเรียนรู้ของมนุษย์ที่รู้จักอะไรก็ตาม ต้องเริ่มจากการเปรียบเทียบกับสิ่งที่รู้จัก เช่น คำว่า แบงก์ แปลว่า ธนาคาร ธนบัตร หรือ แหล่งน้ำ ถ้าหมายถึง สถานที่รับฝากเงิน ก็จะตัดธนบัตร และแหล่งน้ำออกไป เรียกว่าเป็นการอธิบายความหมายของคำ โดยการใช้การเปรียบเทียบ แล้วแยกแยะเป็นกลไกในการจัดการ ทั้งนี้ตัวคุยจะเป็นรากฐานของระบบอี-ฟอรัมของ STKC
ผู้อำนวยการ ทีซีแอล อธิบายอีกว่า คุยที่นำมาทดลองใช้นั้นมีอยู่ 3 ลักษณะ ได้แก่
คุย โพล หรือ ระบบสถาปนาความรู้ด้วยโพล (KuiPoll) ใช้สำรวจความคิดเห็นของประชาชนในหัวข้อที่กำหนด เป็นเครื่องมือสำหรับการวิเคราะห์ลักษณะของชุมชน เป็นความร่วมมือระหว่าง ทีซีแอล มหาวิทยาลัยบูรพา และมหาวิทยาลัยราชภัฏสวนดุสิต โดยการสนับสนุนของ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ หรือ เนคเทค ในด้านการปรับปรุงช่วงทดลองใช้เคยทำกับการทำประชาพิจารณ์ร่างรัฐธรรมนูญปี 2550 ที่มหาวิทยาลัยบูรพา และองค์การบริหารส่วนตำบลบางแห่ง
คุย ซายน์ หรือระบบสถาปนาองค์ความรู้ด้านวิทยาศาสตร์ (KuiSci) โดยความร่วมมือระหว่างกระทรวงวิทยาศาสตร์และเทคโนโลยี กับ เอ็นไอซีที ญี่ปุ่น เพื่อเผยแพร่ภายใต้ STKC อันจะเป็นโครงข่ายพื้นฐานเพื่อการแลกเปลี่ยนความรู้ ข้อคิดเห็นของนักวิจัยในสาขาวิทยาศาสตร์และเทคโนโลยี สำหรับการแก้ไขปัญหาระดับชาติแบบบูรณาการ
คุย เฮิร์บ หรือ ระบบสถาปนาองค์ความรู้ด้านสมุนไพร (KuiHerb) เป็นความร่วมมือระหว่างมหาวิทยาลัยศิลปากร มหาวิทยาลัยสงขลานครินทร์ และทีซีแอล โดยการสนับสนุนของเนคเทค ในการรวบรวมความรู้เรื่องสมุนไพรจากชุมชนต่างๆ เพื่อให้ได้ข้อมูลชื่อเรียก สรรพคุณทางการแพทย์ และวิธีการใช้สมุนไพรที่มีความครอบคลุมและน่าเชื่อถือ
เรื่องนี้จำเป็นต้องทำให้คนสนใจ และอยากเข้ามาปรับปรุงเนื้อหา คืนความรู้ให้กับสังคมมากขึ้น ก็ได้มีการพูดคุยกับ STKC อยู่ในการให้นักวิจัยเข้ามาช่วยเป็นผู้แนะนำการใช้งาน ทั้งนี้เราต้องการสร้างระบบแปลภาษาที่มีประสิทธิภาพ เพื่อลดความแตกต่างทางภาษาต่างประเทศ และภาษาไทย ด้วยการใช้ คุย เป็นตัวสร้างฐานข้อมูล แปล แล้วเอาข้อมูลความรู้ที่ได้มาใช้ ดังนั้นเรื่องนี้พูดได้ว่ายังไม่เคยมีหน่วยงานไหนในโลกคิดทำแบบนี้ จึงถือเป็นความท้าทายที่น่าตื่นเต้นของทีมงานเอ็นไอซีที ดร.วิรัช กล่าว
ด้าน นายโอโมริ ชินโก รองประธาน เอ็นไอซีที แห่งประเทศญี่ปุ่น กล่าวว่า ตัวระบบ KUI จะนำไปสู่การสร้าง Semantic Web หรือ เว็บ 3.0 เพื่อเอามาเชื่อมโยงความหมายของเนื้อหาบนเว็บไซต์แก่ผู้อ่าน เป็นการป้องการค้นหาข้อมูลที่กว้างมากเกินไป อีกทั้งทำให้การสืบค้นและเชื่อมโยงข้อมูลได้เร็วขึ้น ถือเป็นแนวทางในการสร้างเว็บไซต์ในอนาคต ส่วนเว็บไซต์ในขณะนี้ จะทำให้การเชื่อมโยงข้อมูลระหว่างเว็บดีขึ้น อย่างไรก็ตาม ในส่วนของการแปลภาษาบางอย่าง ขึ้นกับวัฒนาธรรมของเจ้าของภาษา บางคำ บางเรื่องก็แปลไม่ได้ ทุกวันนี้อาศัยการค่อยๆ แปลเพิ่มเข้าไปทั้งศัพท์ภาษาอังกฤษ และญี่ปุ่น ขึ้นอยู่กับว่าจะแปล Semantic Web ได้มากแค่ไหน
รองประธาน เอ็นไอซีที แห่งประเทศญี่ปุ่น อธิบายเสริมว่า ถ้าเป็นไปได้เราก็อยากจะไปรวมกับระบบการค้นหาของกูเกิล หรือไมโครซอฟท์ ไลฟ์ เสิร์ช เพราะมองแล้วว่าหากสังคมออนไลน์นี้มีหลายคนเข้ามาร่วมหารือในบางเรื่อง ก็จะมีการนำเสนอข้อมคิดเห็นต่างๆ จนนำไปสู่การได้ข้อสรุปมา และข้อสรุปนี้ คือ ความเห็นของคนใดคนหนึ่งที่ได้การยอมรับจากชุมชนแล้ว ดังนั้นในโลกไซเบอร์เราจะใช้คุยเป็นตัวหลักเพื่อหาองค์ความรู้ รวมถึงการทำผลการสำรวจ หรือ โพล ที่สามารถออกมาในแบบการหารือออนไลน์สดๆ ทำให้ข้อมูลมีการเคลื่อนไหวมากกว่าเดิม ทั้งนี้ คุยยังอยู่ในขั้นทดลอง เพื่อให้ระบบดีมากขึ้นกว่านี้
ทั้งหมดนี้ เป็นอีกหนึ่งผลงานที่มาจากความตั้งใจ และการทุ่มเทความรู้ และกำลังกายที่มี เพื่อให้คนไทยได้มีเครื่องมือที่ช่วยให้เข้าถึงแหล่งความรู้จากต่างประเทศ ลดกำแพงทางด้านภาษา ทำให้การสื่อสารระหว่างกันทำได้แบบไร้พรมแดน รวมถึงปูทางสู่การเตรียมพร้อมรับยุคเว็บ 3.0 อย่างไรก็ตามทั้งหมดของโครงการยังอยู่ในช่วยการทดลอง ผู้ที่สนใจลองเข้าไปศึกษาได้ที่เว็บไซต์ www.tcllab.org/kui เชื่อได้ว่าหากโครงการสมบูรณ์พร้อมเปิดสู่บุคคลภายนอกเมื่อใด สังคมอุดมปัญญาไม่ไกลเกินจริงแน่นอน...
จุลดิศ รัตนคำแปง itdigest@thairath.co.th |