Crawl the music lyrics or comments for GAN training
项目功能: 爬取netease cloud music中的歌曲的歌词、歌曲文件(也可以扩展到爬取评论等数据)
项目目的:基于GAN训练歌词生成,和评论生成等
实现了网易云音乐的接口(获取歌手专辑、专辑歌曲、歌词、音频),详见NeteaseCloudMusicApi
NetEaseApi.py
fetcher.py
prepare.py
中的prepare_artist_jobs
, 会生成一个sqlite db, “artists.db”artist_spider.py
去爬每个歌手所有专辑下的歌曲idprepare.py
中的prepare_music_jobs
, 会生成一个sqlite db, “musics.db”music_spider.py
去抓取每个歌曲的歌词和歌曲,考虑到歌曲抓取时间较长,可以控制只抓取歌曲, 通过ftype=’mp3’|’lrc’控制DbClient.py
封装了netease cloud music的请求