音乐情绪辨识
音乐情绪辨识(Music Emotion Recognition)是借由分析音乐资讯,自动辨识音乐所要表达的情绪。音乐情绪辨识本身是个跨领域的研究,同时需要心理学、音乐学及资讯科学的知识。
常见的情绪辨识方法
基于音乐内容的音乐辨识系统
此类系统利用讯号处理以及机器学习演算法训练模型,对音乐抽取特征并加以分析,借此找出音乐特征与受测者对音乐情绪标示的关联。 以下列出最常使用的机器学习方法:
借由寻找最佳分界平面将资料分开,如此一来便可以利用最佳分界平面将新的测试资料归类。
- Support Vector Regression(SVR)
SVR与SVM的概念类似。不同之处在于SVM所找的平面将空间一分为二,但SVR要找的是能准确预测资料分布的平面。 机器学习后,通常使用交叉验证来对准确度加以验证。交叉验证主要是将资料库随机分成数个不重叠的部分,每次提取一个部分做测试资料,剩馀的作为训练资料。其作法是基于:
- 训练资料与测试资料需有相同的性质
- 训练资料与测试资料不重复
而机器学习最常使用的流程如下:
- 产生训练模型:将训练资料进行特征抽取,同时将所有训练资料交由受测者标定情绪,借由以上两者产生训练模型。
- 测试资料:将测试资料进行特征抽取,交给训练模型进行情绪辨识,产生音乐情绪。
分类法
使用各种形容词当作情绪标签者称之。例如:有趣的(fun)、强烈的(intense)、甜蜜的(sweet)等。此法常用SVM作为机器学习的演算法,训练出一个或多个模型。
座标法
借由定义出二维或三维的情绪座标,将情绪展开成为平面或空间。
最常被使用的情绪平面是泰尔二维情绪平面,纵轴与横轴皆介于-1到1之间,其中纵轴为激昂度,越上方表情绪越激昂;横轴为正向度,越右方表情绪越正向。如此一来,每一首歌都可以被标示在情绪平面中。不同于分类法,座标法中的情绪是连续,此处选择的机器学习方法为SVR。
基于文字的音乐情绪辨识系统
除了使用分析音乐讯号的方法,还可以利用文字资讯以及资料探勘的技术对音乐情绪加以分析。
参见
参考文献
- P. N. Juslin and J. A. Sloboda. Music and Emotion: Theory and Research. Oxford University Press, New York, 2001.
- A. Wieczorkowska, P. Synak, and Z. W. Ras. Multi-label classification of emotions in music. In Proc. Intelligent Information Processing and Web Mining, pp. 307-315, 2006.
- L. Lu, D. Liu, and H. Zhang. Automatic mood detection and tracking of music audio signals. In IEEE Transaction Audio, Speech and Language Processing, vol. 14, no. 1, pp.5–18, 2006.
- Y. -H. Yang, Y. -C. Lin, Y. -F. Su, and H.-H. Chen. A regression approach to music emotion recognition. In IEEE Transactions on Audio, Speech and Language Processing, vol. 16, no. 2, pp. 448–457, 2008.
- R. O. Duda, P. E. Hart, and D. G. Stork. Pattern Classification. John Wiley & Sons, Inc., New York, 2000
- R. W. Picard. Affective Computing. MIT Press, Cambridge, MA, 2000.
- L. Lu, D. Liu, and H. -J Zhang. Automatic mood detection and tracking of music audio signals. In IEEE Transactions on Audio, Speech, and Language Processing, vol. 14, no. 1, 2006.
- K. Hevner. Expression in music: a discussion of experimental studies and theories. In Psychol. Rev., vol. 42, pp. 186–204, 1935.