อาจกล่าวได้ว่าปี 2023 เป็นปีที่ AI ได้กลายมาเป็นเครื่องมือที่เข้ามาเปลี่ยนวิถีการทำงานของเราอย่างกว้างขวาง ไม่ว่าจะเป็นการช่วยเขียนบทความ แต่งบทประพันธ์ การสร้างภาพประกอบ และล่าสุดการสร้างภาพเคลื่อนไหวจากการคีย์ข้อความได้สมจริงอย่างอัศจรรย์ ส่งผลให้บริษัทผู้อยู่เบื้องหลังการพัฒนานวัตกรรมดังกล่าวขึ้นแท่นองค์กรที่มีมูลค่าและอิทธิพลสูงที่สุดในโลก อาทิ NVIDIA ผู้พัฒนาชิพประมวลผล AI Microsoft ที่ได้นำความสามารถของ ChatGPT มาพัฒนาต่อยอดเป็น Copilot ระบบ AI ที่ช่วยเสริมศักยภาพพนักงานออฟฟิศให้สามารถทำงานได้อย่างรวดเร็ว เป็นต้น
เทคโนโลยี AI ในปี 2024 ย่อมจะต้องได้รับการพัฒนาให้มีความสามารถมากขึ้น โดยเฉพาะการพัฒนาให้มีความสามารถในการเรียนรู้และปรับตัวได้ดีขึ้นผ่านการเรียนรู้เชิงลึก (Deep Learning) และการเรียนรู้เสริมแรง (Reinforcement Learning) ทำให้ AI สามารถทำความเข้าใจข้อมูลที่ซับซ้อนและแก้ไขปัญหาได้ดียิ่งขึ้น นอกจากนี้ยังมีการพัฒนาในด้านของการประมวลผลภาษาธรรมชาติ (Natural Language Processing, NLP) ทำให้ AI สามารถสื่อสารและทำความเข้าใจภาษามนุษย์ได้ดีขึ้น ความสามารถของ AI ที่เพิ่มขึ้นดังกล่าวย่อมสร้างความวิตกกังวลต่อผู้กำหนดนโยบายและผู้ออกกฎหมาย ทำให้เกิดแรงกดดันให้ภาครัฐเร่งออกมาตรการและตราระเบียบเพื่อให้แน่ใจว่าการพัฒนา AI จะสร้างประโยชน์มากกว่าโทษให้กับประชาชน และไม่ทิ้งคนกลุ่มใดกลุ่มหนึ่งไว้เบื้องหลัง และต่อไปนี้คือประเด็นเกี่ยวกับ AI ที่น่าจับตาในปีมังกรครับ
แพลตฟอร์ม AI ที่ให้คุณสร้างแชทบอทของคุณเอง
ในปี 2024 บริษัทเทคโนโลยีที่ทุ่มงบประมาณมหาศาลไปกับการพัฒนา Generative AI ย่อมต้องได้รับแรงกดดันว่าจะสามารถสร้างเม็ดเงินจากผลิตภัณฑ์ดังกล่าวได้อย่างไร เช่นนี้แล้ว ยักษ์ AI อย่าง Google และ OpenAI กำลังเดิมพันครั้งใหญ่ด้วยการมุ่งไปยังกลุ่มเป้าหมายขนาดเล็ก กล่าวคือ ผู้เล่นรายใหญ่ทั้งสองกำลังพัฒนาแพลตฟอร์มใช้งานง่ายที่อนุญาตให้ผู้ใช้ปรับแต่งโมเดลภาษาที่ทรงพลังและสร้างแชทบอทขนาดเล็กของตัวเองที่ตอบสนองต่อความต้องการเฉพาะตัวโดยที่ผู้ใช้งานไม่ต้องมีทักษะการเขียนโค้ดแต่อย่างใด ซึ่งที่ผ่านมายักษ์ใหญ่ทั้งสองได้เปิดตัวเครื่องมือบนเว็บที่อนุญาตให้ใครก็ได้เป็นนักพัฒนาแอป Generative AI ไปเรียบร้อย
เช่นนี้แล้ว ในปี 2024 เราคงจะเริ่มเห็น Generative AI เข้ามามีบทบาทกับคนธรรมดาที่ไม่ได้ทำงานในสายเทคโนโลยีมากขึ้น ส่งผลให้ตลาดเต็มไปด้วย AI ที่ได้รับการปรับแต่งให้ทำงานเฉพาะทางเป็นจำนวนมาก โมเดล AI ที่ทันสมัยที่สุด เช่น GPT-4 และ Gemini ไม่เพียงแต่จะสามารถประมวลผลข้อความได้อย่างเดียวเท่านั้น แต่ยังรวมถึงรูปภาพและแม้กระทั่งวิดีโอ ความสามารถใหม่นี้อาจปลดล็อกแอปใหม่ ๆ มากมาย ตัวอย่างเช่น นายหน้าอสังหาริมทรัพย์สามารถอัปโหลดข้อความจากรายการสินทรัพย์ที่ขายก่อนหน้า ปรับแต่งโมเดลเพื่อสร้างข้อความที่คล้ายคลึงกันด้วยการคลิกปุ่มเพียงครั้งเดียว อัปโหลดวิดีโอและรูปภาพของรายการสินทรัพย์ใหม่ และขอให้ AI เฉพาะทางที่ได้รับการพัฒนาขึ้น สร้างคำอธิบายของทรัพย์สินใหม่ เป็นต้น
แน่นอนว่าแนวคิดดังกล่าวจะเป็นจริงนั้นก็ต้องขึ้นอยู่กับว่าโมเดล AI เหล่านี้ทำงานได้ผลเป็นที่น่าเชื่อถือได้มากน้อยเพียงใด เพราะที่ผ่านมา Generative AI มักสร้างข้อความขึ้นมาเองโดยปราศจากแหล่งที่มา ส่วนโมเดล AI ส่วนใหญ่ก็ยังมีความเอนเอียงอยู่ นอกจากนี้ บริการบนหน้าเว็บยังง่ายต่อการถูกแฮ็คอีกด้วย เห็นได้ว่ายักษ์ใหญ่ด้าน AI ทั้งหลายยังมีการบ้านที่ต้องทำอีกมากทีเดียว
ภาพเคลื่อนไหวที่สร้างด้วย AI
เมื่อปีที่ผ่านมา โลกได้ตื่นตะลึงไปกับภาพนิ่งที่สร้างด้วยเครื่องมือ AI อย่าง DALL-E ของ OpenAI Stable Diffusion ของ Stability AI และ Firefly ของ Adobe มาในปี 2024 นี้ โลกย่อมตื่นเต้นไปกับภาพเคลื่อนไหวที่สร้างด้วยเครื่องมือ AI จากผู้พัฒนาดังกล่าวกันบ้าง ว่ากันว่า หากเทคโนโลยี text-to-image สามารถสร้างแรงกระเพื่อมต่อสังคมได้มากเท่าใด เทคโนโลยี text-to-video ก็สามารถสร้างแรงกระเพื่อมได้มากกว่านั้นหลายเท่า
Runway สตาร์ทอัปที่ทำโมเดลวิดีโอ generative (และบริษัทที่ร่วมสร้าง Stable Diffusion) กำลังเร่งพัฒนานวัตกรรม text-to-video ดังกล่าว โดยโมเดลล่าสุดที่เรียกว่า Gen-2 นั้นมีความสามารถในการสร้างวิดีโอที่อาจยาวเพียงไม่กี่วินาที แต่คุณภาพนั้นน่าประทับใจมาก โดยมีคุณภาพเกือบเทียบเท่าการ์ตูนของ Pixar เลยทีเดียว และเพื่อเป็นการกระตุ้นความสนใจ บริษัท Runway ยังได้จัดเทศกาลภาพยนตร์ AI ประจำปี ซึ่งจะแสดงภาพยนตร์ที่สร้างด้วยเครื่องมือ AI เป็นการเฉพาะอีกด้วย โดยเงินรางวัลสูงสุดของเทศกาลในปีนี้มีมูลค่าสูงสุดถึง 60,000 ดอลลาร์ และภาพยนตร์ที่ดีที่สุด 10 เรื่องจะถูกนำไปฉายในเมืองใหญ่อย่างนิวยอร์กและลอสแอนเจลิส
ด้วยความสามารถที่น่าทึ่งดังกล่าว จึงไม่แปลกใจที่ยักษ์ใหญ่ในวงการภาพยนตร์อย่างบริษัท Paramount และ Disney กำลังคิดหาวิธีการนำ AI มาใช้ในการผลิตภาพยนตร์ ปัจจุบันเทคโนโลยี AI ได้ถูกนำไปใช้ในการ lip-sync การแสดงของนักแสดง และการแปลเป็นภาษาต่างประเทศเพื่อให้ภาพยนตร์สามารถเข้าถึงกลุ่มเป้าหมายได้หลายชาติหลายภาษา นอกจากนี้ ยังได้มีการนำ AI ไปใช้ในงานสเปเชียลเอฟเฟ็กต์ด้วย ยกตัวอย่าง ภาพยนตร์เรื่อง Indiana Jones and the Dial of Destiny ที่ออกฉายเมื่อปีที่แล้ว ใบหน้าของดารา Harrison Ford ที่ปรากฏในภาพยนตร์ได้ถูก AI ปรับแต่งให้อ่อนเยาว์ลง
นอกเหนือจากโลกจอเงินแล้ว เทคโนโลยี deepfake สำหรับใช้ในการการตลาดหรือการฝึกอบรมก็มีแนวโน้มได้รับความนิยมเพิ่มขึ้น ตัวอย่างเช่น บริษัท Synthesia ที่ตั้งอยู่ในสหราชอาณาจักร ได้พัฒนาเครื่องมือที่สามารถเปลี่ยนการแสดงครั้งเดียวของนักแสดงไปเป็นอวตาร์ deepfake ที่สามารถนำไปใช้งานต่อได้อย่างไม่มีที่สิ้นสุด โดยสามารถอ่านสคริปต์ที่ป้อนให้ด้วยการกดปุ่มเพียงครั้งเดียว ทางบริษัทอ้างว่าได้มีบริษัทในกลุ่ม Fortune 100 กว่าร้อยละ 44 นำเทคโนโลยีดังกล่าวไปใช้งานแล้ว
อย่างไรก็ดี เทคโนโลยีดังกล่าวได้ก่อให้เกิดคำถามที่ร้ายแรงกับบรรดาศิลปินและนักแสดง การสไตรก์ SAG-AFTRA เมื่อปีที่แล้วมีสาระสำคัญอยู่ที่การใช้งานเทคโนโลยี AI อย่างผิด ๆ ของบรรดาสตูดิโอต้นสังกัดทั้งหลาย จึงกล่าวได้ว่าเทคโนโลยี text-to-video ยังต้องเผชิญกับความท้าทายอีกมากกว่าจะเป็นที่ยอมรับในวงกว้าง
ข่าวลวงที่สร้างโดย AI จะพบได้บนโลกออนไลน์ทุกที่
การแพร่กระจายข่าวลวงและวิดีโอ deepfake ที่เกิดขึ้นในช่วงที่ผ่านมาได้ทำให้หลายฝ่ายออกมาแสดงความวิตกกังวล โดยเฉพาะอย่างยิ่งข่าวลวงและ deepfakes ที่สร้างด้วย AI ซึ่งมีความแนบเนียนกว่า จะกลายเป็นปัญหาที่ใหญ่ในปีนี้ เนื่องจากเป็นปีที่จะมีการเลือกตั้งเกิดขึ้นทั่วโลกมากกว่าครั้งใด ๆ ในประวัติศาสตร์ ซึ่งที่ผ่านมาพวกเราเห็นแล้วว่านักการเมืองได้มีการใช้เครื่องมือเหล่านี้เป็นอาวุธในการโจมตีฝั่งตรงข้าม ยกตัวอย่าง ในอาร์เจนตินา สองผู้สมัครรับเลือกตั้งประธานาธิบดีได้สร้างภาพและวิดีโอด้วย AI เพื่อใช้ในการสาดโคลนคู่แข่ง ในสโลวาเกีย deepfakes ของผู้นำพรรคสนับสนุนยุโรปที่ขู่ว่าจะเพิ่มราคาเบียร์และทำตลกเกี่ยวกับการค้าประเวณีเด็กได้กระจายไปทั่วระหว่างการเลือกตั้งทั่วไป ส่วนในสหรัฐอเมริกา ดอนัลด์ ทรัมป์ได้ออกมากล่าวสนับสนุนกลุ่มที่ใช้ AI สร้างมีมที่มีเนื้อหาเหยียดชาติพันธุ์และเหยียดเพศ เป็นต้น
ถึงแม้จะเป็นเรื่องยากที่จะบอกว่าตัวอย่างเหล่านี้มีอิทธิพลต่อผลการเลือกตั้งมากน้อยเพียงใด แต่การเพิ่มขึ้นของเทคนิคสกปรกเช่นนี้ได้สร้างความวิตกกังวลให้เกิดขึ้น โดยเฉพาะเมื่อเทคโนโลยี AI ทำให้การแยกแยะข่าวลวงออกจากข้อเท็จจริงทำได้ยากมากขึ้น และเมื่อนำไปผนวกกับสภาพสังคมในปัจจุบันที่มักมีการแบ่งฝักแบ่งฝ่ายอย่างชัดเจนเป็นทุนเดิมอยู่แล้ว ก็ยิ่งทำให้ผลกระทบที่เกิดขึ้นมีความรุนแรงเพิ่มเข้าไปอีก
ไม่กี่ปีก่อนหน้า การสร้าง deepfake จะต้องใช้ทักษะทางเทคนิคขั้นสูง แต่เทคโนโลยี Generative AI ทำให้มันง่ายและสามารถเข้าถึงได้อย่างสะดวก และผลลัพธ์ก็ดูเหมือนจริงมากขึ้นทุกที แม้แต่แหล่งข้อมูลที่น่าเชื่อถือก็อาจถูกหลอกโดยเนื้อหาที่สร้างด้วย AI ตัวอย่างเช่น ช่วงที่ผ่านมาภาพที่ผู้ใช้ส่งเข้ามาที่สร้างด้วย AI ที่อ้างว่าเป็นภาพของวิกฤติการณ์อิสราเอล-กาซา ได้ปรากฏบนตลาดค้าภาพออนไลน์ของ Adobe เต็มไปหมด
ดังนั้น ปี 2024 จึงเป็นปีสำคัญที่บริษัทเทคโนโลยีที่เกี่ยวข้องต้องคิดหาวิธีป้องกันไม่ให้เกิดเหตุดังกล่าว อย่างไรก็ดี เทคโนโลยีดังกล่าวยังอยู่ในขั้นเริ่มต้นของการพัฒนา เทคนิคการใส่ลายน้ำ เช่น SynthID ของ Google DeepMind ยังเป็นแบบสมัครใจและไม่ได้ป้องกันได้แน่นอน ส่วนแพลตฟอร์มโซเชียลมีเดียก็มีชื่อเสียในการลบข้อมูลที่ผิดพลาดช้าอยู่แล้ว เพราะฉะนั้น เทคนิคที่จะป้องกันไม่ให้ข่าวลวงที่สร้างโดย AI แพร่กระจายในวงกว้างก็คือ ชัวร์ก่อนแชร์
สรุป
เทคโนโลยี Generative AI ได้รับการพัฒนาไปอย่างก้าวกระโดด จากความสามารถในการสร้างตัวอักษรและภาพนิ่งได้อย่างสมจริง ไปสู่การสร้างภาพเคลื่อนไหวที่มีความลื่นไหล จากการใช้งานที่ยังอยู่ในวงจำกัดในช่วงเริ่มต้น ไปสู่การปรับแต่ง AI เฉพาะทางที่ใคร ๆ ก็ทำได้ อย่างไรก็ตาม การพัฒนาดังกล่าวได้เพิ่มความเสี่ยงด้านการแพร่กระจายข่าวลวงโดยเฉพาะในช่วงการเลือกตั้งจะเกิดขึ้นทั่วโลกในปีนี้ ประกอบกับยังไม่มีวิธีการป้องกันที่สามารถใช้ได้ผลอย่างชะงัด จึงเป็นหน้าที่ของพวกเราทุกคนที่ต้องเสพข่าวสารอย่างระมัดระวัง
สำหรับบทความหน้าผมจะพูดถึง myth ที่หลายคนน่าจะเคยได้ยินมาบ้างว่า สมาร์ทโฟนที่ใช้กันอยู่อาจกำลังดักฟังคำพูดของเราเพื่อป้อนให้กับตลาดโฆษณา คำกล่าวอ้างนี้จะเป็นจริงมากน้อยแค่ไหน เป็น fake news หรือไม่ พบคำตอบได้ในบทความหน้าครับ