Share

วิวัฒนาการของ AI สำหรับดนตรี

13/06/2024

เหมือนกับทุกที่ที่คุณหันไป บริษัทต่างๆ ก็ผุดขึ้นมาในแวดวง AI สร้างสรรค์สำหรับดนตรี เพียงแค่ในช่วงสองสามเดือนที่ผ่านมา เราได้เห็นการเปิดตัวทั้ง Suno และ Udio แต่ AI สร้างสรรค์สำหรับดนตรีนั้นไม่ได้เพิ่งเกิดขึ้น – มันมีมานานหลายทศวรรษในรูปแบบต่างๆ เพียงแต่มากกว่าทศวรรษที่ผ่านมา พลังการเรียนรู้ของเครื่อง Machine Learning และพลังประมวลผลได้ตามทันวิสัยทัศน์ ทำให้กระบวนการใช้ประโยชน์จากเทคโนโลยีคอมพิวเตอร์เพื่อสร้างเพลงได้อย่างรวดเร็ว ราบรื่นยิ่งขึ้น

ประวัติศาสตร์ของ AI สร้างสรรค์สำหรับดนตรี เกี่ยวข้องกับวิวัฒนาการอันน่าทึ่งของเทคโนโลยีที่ทำให้คอมพิวเตอร์สามารถสร้างดนตรีได้อย่างต่อเนื่อง ไม่ว่าจะโดยอัตโนมัติหรือเป็นเครื่องมือสำหรับนักแต่งเพลง ดังนี้คือภาพรวมของการพัฒนานี้:

1.การทดลองในยุคแรก (1950s-1970s)

การสำรวจเกี่ยวกับดนตรีสร้างสรรค์ เริ่มต้นขึ้นพร้อมกับการถือกำเนิดของคอมพิวเตอร์ ตัวอย่างแรก ๆ อย่างหนึ่งคือ Illiac Suite สำหรับสตริงควาร์เต็ต (1957) สร้างโดย Lejaren Hiller และ Leonard Isaacson ซึ่งเป็นชิ้นดนตรีชิ้นแรกที่แต่งขึ้นโดยใช้เทคนิคการแต่งเพลงแบบอัลกอริทึมร่วมกับคอมพิวเตอร์ 

2.การแต่งเพลงแบบอัลกอริทึมและ MIDI (1980s-1990s)

ในช่วงทศวรรษ 1980 และ 1990 การเติบโตของคอมพิวเตอร์ส่วนบุคคลและเทคโนโลยี MIDI (Musical Instrument Digital Interface) ทำให้การทดลองและพัฒนาการแต่งเพลงแบบอัลกอริทึมมากขึ้น ซอฟต์แวร์อย่าง Csound ภาษาที่ใช้ประมวลผลเสียงและสังเคราะห์เสียง ได้รับความนิยมในหมู่นักประพันธ์เพลงสำหรับการสร้างเสียงและโครงสร้างดนตรีที่ซับซ้อน 

3.การผสมผสานการเรียนรู้ของเครื่อง (Machine Learning) และ AI (ตั้งแต่ปี 2000)

ด้วยการเติบโตของการเรียนรู้ของเครื่องในช่วงต้นทศวรรษ 2000 นักวิจัยเริ่มนำเทคนิคเหล่านี้ไปใช้กับการสร้างดนตรี โปรแกรมอย่าง “Experiments in Musical Intelligence” (EMI) ของ David Cope ได้รับความสนใจในการสร้างดนตรีในสไตล์ของนักแต่งเพลงคลาสสิกอย่าง Bach และ Mozart โดยใช้ระบบ AI แบบอิงกฎ

4.การปฏิวัติ Deep Learning (2010s-ปัจจุบัน)

การนำเสนอ Deep Learning ได้เปลี่ยนโฉมศักยภาพของ AI ในดนตรีอย่างมากมาย เครือข่ายประสาทเทียม (Neural Networks) ที่สามารถเรียนรู้จากชุดข้อมูลดนตรีขนาดใหญ่ เริ่มสร้างสรรค์บทประพันธ์ดนตรีที่น่าเชื่อถือและซับซ้อนมากขึ้น พัฒนาการที่น่าสังเกต ได้แก่ โปรเจ็กต์ Magenta ของ Google ซึ่งใช้ TensorFlow ในการสร้างเครื่องมือและโมเดลสำหรับการสร้างดนตรี [4] และ Jukebox ของ OpenAI ซึ่งเป็นโมเดลที่สร้างดนตรี รวมถึงการร้องเพลงเบื้องต้น ในสไตล์ต่างๆ และความคล้ายคลึงของศิลปิน

5.การค้าและการเข้าถึง (2010s-ปัจจุบัน)

ในช่วงไม่กี่ปีที่ผ่านมา เทคโนโลยีดนตรีที่ขับเคลื่อนด้วย AI ได้รับการนำเสนอเป็นผลิตภัณฑ์เชิงพาณิชย์มากขึ้น บริษัทสตาร์ทอัพและบริษัทต่างๆ ได้พัฒนาแอปพลิเคชันที่ช่วยนักดนตรีในการแต่งเพลง การบรรเลงประกอบ (accompaniment) และแม้กระทั่งการแสดง สิ่งที่น่าสนใจคือ เครื่องมืออย่าง Amper Music (ก่อตั้งในปี 2014 และถูกซื้อกิจการโดย Shutterstock ในปี 2020) [6] และ Jukedeck (ก่อตั้งโดย Ed Newton-Rex ในปี 2012 และถูกซื้อกิจการโดย Tik Tok/ByteDance ในปี 2019) [7] ซึ่งเป็นแพลตฟอร์มที่ผู้ใช้สามารถสร้างสรรค์เพลงโดยใช้ระบบที่ขับเคลื่อนด้วย AI ทำให้เทคโนโลยีนี้เข้าถึงผู้ที่ไม่ใช่ผู้เชี่ยวชาญได้ง่ายขึ้น ในช่วงเวลานั้น ผมได้ให้คำแนะนำเบื้องต้นกับอีกหนึ่งบริษัทในช่วงเริ่มต้นที่ชื่อ Humtap ซึ่งมีแนวทางที่คล้ายคลึงกัน

ในช่วงฤดูใบไม้ร่วงปี 2023 หลังจากที่ Google เปิดตัว MusicLM เครื่องมือแปลงข้อความเป็นดนตรีที่สร้างเพลงจากคำสั่งง่ายๆ ไม่นาน พอล แมคคาร์ทนีย์ใช้ปัญญาประดิษฐ์ในการดึงเสียงของจอห์น เลนนอนออกมาสำหรับเพลงใหม่ของ The Beatles (ซึ่งจะเป็นไปไม่ได้เลยหากไม่มี AI) และ Meta เปิดตัวโมเดลการสร้างสรรค์ดนตรีแบบโอเพ่นซอร์ส (เรียกว่า MusicGen) ซึ่งเปลี่ยนคำสั่งข้อความพื้นฐานเป็นตัวอย่างดนตรีที่มีคุณภาพดี

แทนที่จะเป็นเพียงแค่ ‘เทรนด์ล่าสุด’ หลายคนมองว่าวงการ AI สร้างสรรค์ทางดนตรีกำลังคึกคักอย่างมากในยุคนี้ ลองพิจารณาบริษัทที่ดำเนินงานอยู่ในพื้นที่นี้เพียงสองสามบริษัท ซึ่งบางบริษัทเพิ่งเปิดตัวเมื่อสองสามสัปดาห์ที่ผ่านมาเท่านั้น เมื่อวิเคราะห์แพลตฟอร์มดนตรี AI สร้างสรรค์อย่าง Boomy AI, Suno และ Udio สิ่งสำคัญคือต้องพิจารณาปัจจัยต่างๆ เช่น เทคโนโลยีของพวกเขา ประสบการณ์การใช้งานของผู้ใช้ ฟังก์ชันการทำงาน และกลุ่มเป้าหมาย ต่อไปนี้เป็นการเปรียบเทียบที่เจาะลึกขึ้นตามองค์ประกอบเหล่านี้:

เทคโนโลยีและฟีเจอร์

  • Boomy AI ใช้ปัญญาประดิษฐ์ช่วยให้ผู้ใช้สร้างเพลงได้อย่างรวดเร็วและง่ายดาย เทคโนโลยีของ Boomy เน้นที่การสร้างเพลงแบบทันใจ โดยมีอัลกอริทึมที่ดูแลทุกอย่างตั้งแต่การแต่งเพลงไปจนถึงการโปรดิวซ์ ผู้ใช้สามารถสร้างเพลงได้ทั้งเพลงเพียงแค่เลือกสไตล์หรือมู้ดที่ต้องการ
  • Suno ใช้ปัญญาประดิษฐ์ช่วยในกระบวนการแต่งเพลง ช่วยผู้ใช้สร้างเมโลดี้ คอร์ด และแม้กระทั่งเรียบเรียงเพลงได้อย่างสมบูรณ์ เทคโนโลยีของ Suno มุ่งเน้นไปที่การเสริมกระบวนการสร้างสรรค์ โดยมอบเครื่องมือที่ช่วยให้ผู้ใช้ประยุกต์ใช้ทฤษฎีดนตรีได้อย่างมีประสิทธิภาพ ช่วยเชื่อมช่องว่างระหว่างความคิดสร้างสรรค์และความรู้ทางเทคนิค
  • Udio มีเครื่องมือสำหรับการมิกซ์และมาสเตอร์ที่ละเอียด ทำให้เป็นตัวเลือกที่ทรงพลังสำหรับการขัดเพลงให้เสร็จ ปัญญาประดิษฐ์ของ Udio
    จะวิเคราะห์แทร็กเสียงเพื่อปรับคุณภาพเสียง ปรับสมดุลของระดับเสียง และใช้เอฟเฟกต์มาสเตอร์เพื่อยกระดับการโปรดิวซ์โดยรวม

ประสบการณ์ผู้ใช้

  • Boomy AI มีอินเตอร์เฟสที่เรียบง่ายและใช้งานง่าย เหมาะสำหรับผู้เริ่มต้นหรือคนที่ไม่ได้เป็นนักดนตรี กระบวนการสร้างเพลงที่รวดเร็วของ Boomy ดึงดูดผู้ใช้ที่ต้องการผลลัพธ์ที่รวดเร็วโดยไม่ต้องเจาะลึกในเรื่องที่ซับซ้อนของการผลิตดนตรี
  • Suno อาจต้องใช้ความรู้ด้านดนตรีเพิ่มเติมเพื่อใช้ประโยชน์จากเครื่องมือแต่งเพลงอย่างเต็มที่ แต่ยังมีส่วนประกอบด้านการศึกษาที่สามารถช่วยให้ผู้เรียนรู้ขณะที่สร้างสรรค์ สิ่งนี้ทำให้ Suno เหมาะสำหรับมือสมัครเล่นหรือกึ่งมืออาชีพ
  • ในฐานะที่ไม่ใช่นักดนตรี ผมเองก็ประหลาดใจอย่างมากที่การสร้างเพลงต้นฉบับที่ฟังดูดีออกมาได้อย่างรวดเร็ว! ถึงแม้ Udio จะดูซับซ้อนกว่า เหมาะสำหรับมืออาชีพหรือผู้ที่ชื่นชอบจริงจังที่มีความเข้าใจด้านวิศวกรรมเสียง อินเตอร์เฟสและเครื่องมือของ Udio ได้รับการออกแบบมาเพื่อให้ควบคุมกระบวนการผลิตเสียงได้อย่างแม่นยำ

ฟังก์ชันการใช้งาน

  • Boomy AI มีฟังก์ชันการใช้งานที่ยอดเยี่ยมในการสร้างเพลงหลากหลายสไตล์ได้อย่างรวดเร็ว มันเน้นไปที่การสำรวจและการสร้างสรรค์แบบอัตโนมัติ มากกว่าการควบคุม
  • Suno มีฟังก์ชันการใช้งานที่รองรับทั้งความคิดสร้างสรรค์และการเรียนรู้ ช่วยให้ผู้ใช้ทดลองกับการแต่งเพลงที่ซับซ้อนโดยใช้คำแนะนำที่รองรับโดย AI
  • Udio โดดเด่นในด้านหลังการผลิต โดยมีฟังก์ชันการใช้งานที่สามารถยกระดับแทร็กที่ดีให้กลายเป็นเพลงที่ดูมืออาชีพ

กลุ่มเป้าหมาย

  • Boomy AI เหมาะสำหรับผู้ใช้ทั่วไป ครีเอเตอร์ และผู้มีอิทธิพลบนโซเชียลมีเดียที่ต้องการเพลงประกอบแบบรวดเร็ว
  • Suno มุ่งเป้าไปที่นักดนตรี นักเรียนดนตรี และผู้เล่นดนตรีเป็นงานอดิเรกที่ต้องการพัฒนาทักษะการแต่งเพลงหรือขจัดอุปสรรคด้านความคิดสร้างสรรค์ด้วยความช่วยเหลือของปัญญาประดิษฐ์
  • Udio เหมาะสำหรับโปรดิวเซอร์ นักดนตรีวิศวกรเสียง และนักดนตรีมืออาชีพที่ต้องการเครื่องมือขั้นสูงสำหรับการขัดเพลงให้เสร็จ

การตัดสินใจเลือกใช้ระหว่าง Boomy AI, Suno และ Udio ขึ้นอยู่กับว่าผู้ใช้กำลังอยู่จุดไหนในเส้นทางการสร้างสรรค์ดนตรีของตัวเอง และให้ความสำคัญกับกระบวนการผลิตด้านใดมากที่สุด Boomy AI เหมาะสำหรับการสร้างสรรค์เพลงรวดเร็วและเรียบง่าย Suno เหมาะสำหรับการเสริมสร้างความคิดสร้างสรรค์ด้านดนตรีและการเรียนรู้ Udio เหมาะสำหรับงานโปรดิวซ์คุณภาพระดับมืออาชีพ แต่ละแพลตฟอร์มต่างตอบสนองกลุ่มผู้ใช้งานเฉพาะได้อย่างมีประสิทธิภาพ ทำให้กลายเป็นเครื่องมือที่มีคุณค่าในแวดวงการผลิตดนตรีด้วยความช่วยเหลือของปัญญาประดิษฐ์ที่กำลังพัฒนาอยู่ตลอดเวลา

สรุป

เมื่อเครื่องดนตรี เทคนิคการอัดเสียง และซินธิไซเซอร์ถูกคิดค้นและพัฒนาขึ้นเรื่อยมา สิ่งเหล่านี้ส่งผลกระทบและขยายฐานทั้งผู้สร้างสรรค์และผู้บริโภคดนตรี ตอนนี้ด้วยเครื่องมือสร้างสรรค์ดนตรีด้วยปัญญาประดิษฐ์ เส้นแบ่งระหว่างศิลปิน โปรดิวเซอร์ และผู้บริโภคเริ่มเลือนลาง

ผู้บริโภคที่ไม่มีความรู้ด้านดนตรี การฝึกอบรม หรือประสบการณ์ สามารถสร้างเพลงต้นฉบับได้อย่างรวดเร็วและแทบจะไร้รอยต่อ กลายเป็นสมาชิกของระบบเศรษฐกิจสร้างสรรค์ควบคู่กับการเป็นแฟนเพลง

แม้คุณภาพของแทร็กที่สร้างโดยผู้บริโภคเหล่านี้อาจจะยังถกเถียงกันได้ แต่ด้วยการย่นระยะห่างระหว่างความคิดและการสร้างสรรค์อย่างมาก ปัญญาประดิษฐ์เป็นเครื่องมือทรงพลังที่อนุญาตให้ผู้คนจำนวนมากขึ้นกว่าเดิมสร้างดนตรี ในขณะเดียวกันก็ช่วยยกระดับความเป็นไปได้ทางสร้างสรรค์ให้กับศิลปินและโปรดิวเซอร์มืออาชีพที่มีอยู่

เทคโนโลยีดนตรีปัญญาประดิษฐ์ที่ก้าวหน้ายังก่อให้เกิดคำถามทางจริยธรรมและความคิดสร้างสรรค์เกี่ยวกับการเป็นผู้สร้างสรรค์ ความคิดสร้างสรรค์ และผลกระทบทางเศรษฐกิจต่อนักดนตรี เส้นแบ่งระหว่างศิลปะที่สร้างโดยมนุษย์และสร้างโดยเครื่องจักรนั้นพร่าเลือนลงเรื่อยๆ นำไปสู่การพูดคุยเกี่ยวกับลิขสิทธิ์ ธรรมชาติของความคิดสร้างสรรค์ และบทบาทของปัญญาประดิษฐ์ในศิลปะ เรื่องนี้ผมจะยังมีอะไรมาแบ่งปันอีกมากมายในอนาคต

ในขณะเดียวกัน ปัญญาประดิษฐ์สร้างสรรค์เพื่อดนตรียังคงพัฒนาต่อไป ขยายขอบเขตของสิ่งที่เครื่องจักรสามารถทำได้ในด้านความคิดสร้างสรรค์ และเปลี่ยนแปลงวิธีการแต่งเพลง การแสดง และการรับรู้ดนตรี

แหล่งอ้างอิง:
[1] Hiller, L. A., & Isaacson, L. M. (1957). Illiac Suite for string quartet. New Music Edition.
[2] Boulanger, R. (Ed.). (2000). The Csound book: perspectives in software synthesis, sound design, signal processing, and programming. MIT press.
[3] Cope, D. (1996). Experiments in musical intelligence (Vol. 12). Madison, WI: AR editions.
[4] Magenta. (n.d.). Retrieved from https://magenta.tensorflow.org/
[5] Dhariwal, P., Jun, H., Payne, C., Kim, J. W., Radford, A., & Sutskever, I. (2020). Jukebox: A generative model for music. arXiv preprint arXiv:2005.00341.
[6] Amper Music. (n.d.). Retrieved from https://www.ampermusic.com/
[7] Vincent, J. (2019). TikTok parent company ByteDance is reportedly making a smartphone. The Verge.
[8] MusicLM: Generating Music From Text. (n.d.). Retrieved from https://google-research.github.io/seanet/musiclm/examples/
[9] Ronson, M. (2023). Turn on, tune in, drop art: how AI is creating music. The Guardian.
[10] Agostinelli, F., Copeland, E., Finethy, J., & Roberts, A. (2023). MusicGen: Simple and Controllable Music Generation. arXiv preprint arXiv:2306.05284.
[11] Boomy. (n.d.). Retrieved from https://boomy.com/
[12] Suno. (n.d.). Retrieved from https://www.suno.ai/
[13] Udio. (n.d.). Retrieved from https://udio.com/
[14] Xing, B. (2023). Suno AI Review — Create Music With AI. BecomingHuman.AI.
[15] Leary, B. (2023). Udio.com Review — Will it be as big as TikTok? Music Entrepreneur HQ.