Image

ดร. อรรถพล ธำรงรัตนฤทธิ์
ฝ่าด่าน Natural Language Processng 
สอน AI ให้เชี่ยวชาญภาษาไทย

Interview

สัมภาษณ์และเรียบเรียง : สุวัฒน์ อัศวไชยชาญ
 ถอดเสียงสัมภาษณ์ : วรรณิดา มหากาฬ
 เวลา : ๑ ชั่วโมง ๓๔ นาที
 วันที่ : ๒๔ มิถุนายน ๒๕๖๔
สถานที่ : ห้องซูมออนไลน์
 ภาพ : คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย

Search Results

งานประจำ :

อาจารย์และนักวิจัยประจำภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย

การศึกษา :

Stanford University ปริญญาตรี Symbolic Systems ซึ่งต้องเรียนสี่ศาสตร์ด้วยกัน คือ Computer Science, Linguistics, Philosophy และ Psychology ปริญญาโทและเอกด้าน Deep Learning สำหรับ Natural Language Processing

หนังสือที่ชอบ :

Hitchhiker’s Guide to the Galaxy

ความเคลื่อนไหว :

หลักสูตร Computational Linguistics ที่เปิดสอนเมื่อปี ๒๕๖๒ มีนิสิตสนใจเรียนเพิ่มขึ้นจาก ๑๐ กว่าคนในปีแรกเป็น ๔๐ คนในปีนี้ (๒๕๖๔)

บทสัมภาษณ์ที่เผยแพร่ :

The Matter, The Standard, aday Bulletin, Voice Online, Jobthai

Image

อยากให้ช่วยอธิบายว่า NLP หรือ natural language processing กับ computational linguistics แตกต่างกันหรือเกี่ยวข้องกันอย่างไร

ถ้าเป็นเมื่อ ๒๐-๓๐ ปีที่แล้วจะแยกกันค่อนข้างชัดเจน สมัยก่อน computational linguistics คือการศึกษาคุณสมบัติต่าง ๆ ของภาษา ทั้งเรื่องเสียง โครงสร้าง การเปลี่ยนแปลงปัจจัยทางสังคม โดยใช้โมเดลทางคณิตศาสตร์มาสร้างแบบจำลองทำให้เราเข้าใจภาษาได้ดีขึ้น  พอระยะหลังเทคโนโลยีพัฒนาขึ้นก็เกิด natural language processing ซึ่งนำเอาโมเดลที่เราใช้ศึกษาภาษานั้นมาทำเป็นโปรแกรมคอมพิวเตอร์เพื่อทำงานด้านภาษาแทนเรา เช่น แปลภาษา สรุปความ สรุปประเด็น วิเคราะห์อารมณ์ความรู้สึก เปลี่ยนตัวหนังสือให้เป็นเสียงพูด 

คำว่า natural language หมายถึงภาษาที่เป็นธรรมชาติซึ่งคนใช้พูดคุยสื่อสารกันและพัฒนาการในตัวมันเอง สมัยก่อนเทคโนโลยีคอมพิวเตอร์ยังไม่ดีพอ เวลาเอามาใช้ในโลกความเป็นจริงก็เลยยังดูไม่ค่อยเป็นธรรมชาติ  ลองนึกถึงโทรศัพท์รุ่นเก่า ๆ เวลาเราหาหมายเลขโทรศัพท์โดยใช้เสียงก็ต้องพูดให้เหมือนเป๊ะ เช่น “เต้” (เน้นเสียงชื่อเล่นของอาจารย์เอง) ก็ต้อง “เต้” ชัด ๆ เหมือนเดิม แต่ตอนนี้เทคโนโลยีดีขึ้น เราบอก Siri ได้ว่า “ช่วยโทรศัพท์หาเต้หน่อย” (เสียงพูดคุยปรกติ) ก็จะเป็นประโยคธรรมชาติมากขึ้น ทำให้กลายเป็นกระแสที่มีแอปพลิเคชันต่าง ๆ มากมายเอามาใช้ในช่วง ๑๐ ปีผ่านมา

“มีอยู่ไม่กี่ภาษาในโลกที่เขียนด้วยระบบที่ไม่แบ่งคำ ไทย จีน พม่า และภาษาของประเทศอื่นๆ แถวบ้านเรา แต่ก็เป็นโจทย์ที่เราต้องมาแก้ใน NLP  ซึ่งความจริงถ้าใช้ deep learning เราไม่ต้องทำอะไรมากนอกจากสร้างตัวอย่างให้โมเดลดู”

Image