ดร. อรรถพล ธำรงรัตนฤทธิ์
ฝ่าด่าน Natural Language Processng
สอน AI ให้เชี่ยวชาญภาษาไทย
Interview
สัมภาษณ์และเรียบเรียง : สุวัฒน์ อัศวไชยชาญ
ถอดเสียงสัมภาษณ์ : วรรณิดา มหากาฬ
เวลา : ๑ ชั่วโมง ๓๔ นาที
วันที่ : ๒๔ มิถุนายน ๒๕๖๔
สถานที่ : ห้องซูมออนไลน์
ภาพ : คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
Search Results
งานประจำ :
อาจารย์และนักวิจัยประจำภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
การศึกษา :
Stanford University ปริญญาตรี Symbolic Systems ซึ่งต้องเรียนสี่ศาสตร์ด้วยกัน คือ Computer Science, Linguistics, Philosophy และ Psychology ปริญญาโทและเอกด้าน Deep Learning สำหรับ Natural Language Processing
หนังสือที่ชอบ :
Hitchhiker’s Guide to the Galaxy
ความเคลื่อนไหว :
หลักสูตร Computational Linguistics ที่เปิดสอนเมื่อปี ๒๕๖๒ มีนิสิตสนใจเรียนเพิ่มขึ้นจาก ๑๐ กว่าคนในปีแรกเป็น ๔๐ คนในปีนี้ (๒๕๖๔)
บทสัมภาษณ์ที่เผยแพร่ :
The Matter, The Standard, aday Bulletin, Voice Online, Jobthai
อยากให้ช่วยอธิบายว่า NLP หรือ natural language processing กับ computational linguistics แตกต่างกันหรือเกี่ยวข้องกันอย่างไร
ถ้าเป็นเมื่อ ๒๐-๓๐ ปีที่แล้วจะแยกกันค่อนข้างชัดเจน สมัยก่อน computational linguistics คือการศึกษาคุณสมบัติต่าง ๆ ของภาษา ทั้งเรื่องเสียง โครงสร้าง การเปลี่ยนแปลงปัจจัยทางสังคม โดยใช้โมเดลทางคณิตศาสตร์มาสร้างแบบจำลองทำให้เราเข้าใจภาษาได้ดีขึ้น พอระยะหลังเทคโนโลยีพัฒนาขึ้นก็เกิด natural language processing ซึ่งนำเอาโมเดลที่เราใช้ศึกษาภาษานั้นมาทำเป็นโปรแกรมคอมพิวเตอร์เพื่อทำงานด้านภาษาแทนเรา เช่น แปลภาษา สรุปความ สรุปประเด็น วิเคราะห์อารมณ์ความรู้สึก เปลี่ยนตัวหนังสือให้เป็นเสียงพูด
คำว่า natural language หมายถึงภาษาที่เป็นธรรมชาติซึ่งคนใช้พูดคุยสื่อสารกันและพัฒนาการในตัวมันเอง สมัยก่อนเทคโนโลยีคอมพิวเตอร์ยังไม่ดีพอ เวลาเอามาใช้ในโลกความเป็นจริงก็เลยยังดูไม่ค่อยเป็นธรรมชาติ ลองนึกถึงโทรศัพท์รุ่นเก่า ๆ เวลาเราหาหมายเลขโทรศัพท์โดยใช้เสียงก็ต้องพูดให้เหมือนเป๊ะ เช่น “เต้” (เน้นเสียงชื่อเล่นของอาจารย์เอง) ก็ต้อง “เต้” ชัด ๆ เหมือนเดิม แต่ตอนนี้เทคโนโลยีดีขึ้น เราบอก Siri ได้ว่า “ช่วยโทรศัพท์หาเต้หน่อย” (เสียงพูดคุยปรกติ) ก็จะเป็นประโยคธรรมชาติมากขึ้น ทำให้กลายเป็นกระแสที่มีแอปพลิเคชันต่าง ๆ มากมายเอามาใช้ในช่วง ๑๐ ปีผ่านมา
“มีอยู่ไม่กี่ภาษาในโลกที่เขียนด้วยระบบที่ไม่แบ่งคำ ไทย จีน พม่า และภาษาของประเทศอื่นๆ แถวบ้านเรา แต่ก็เป็นโจทย์ที่เราต้องมาแก้ใน NLP ซึ่งความจริงถ้าใช้ deep learning เราไม่ต้องทำอะไรมากนอกจากสร้างตัวอย่างให้โมเดลดู”