검색 본문
blog.joonas.io Joonas' Note 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 정말 영어가 많아졌는가? 마침 1964년부터 2023년까지 60년의 데이터가 쌓였고, 결론부터 말하자면 영어 비중은 많아졌다. 1964~2023년 연도별 한글/영어 가사 비율 2023년에 들어서는 영어 가사의 비중이 25% 를 넘을 정도로 많아졌고, 최근에 사람들이 이런 사실을 체감하는 이유는 2011년 이후로 10년만에 영어 비율이 더 커지고 있기 때문으로 보인다. 영어 비중은 2008~2012년 사이에 잠시 상승하고 그 뒤로는 오히려 줄어들더니, 2018년부터 다시 상승한다.2018년에는 BTS가 FAKE LOVE로 빌보드 TOP 10에 처음으로 진입 한국어 가사 분석 형태소 분석기 선택 한국어 형태소 분석에는 여러 라이브러리가 있는데, 처음에 KoNLPy 로 해봤다가 자바 경로 설정 문제가 있어서 다른 걸 알아보던 중, Kiwi가 형용사나 보조 용언 쪽에서 품사 태그를 더 자세히 분류하고 API도 간단해보여서 중간에 Kiwi로 변경했다. (좌) KoNLPy 동사 추출, (우) Kiwi 동사 추출 여담으로 KIWI 개발자 블로그가 있길래 형태소 분석기가 어떤 원리로 개발되었는지 글이 있어서 읽어봤는데 무척 흥미로웠다.관심 있는 사람은 https://bab2min.tistory.com/560 글 국내 가요 내 영단어들 단수/복수형은 어느정도 처리된 것 같은데, 아무래도 apostrophe(')를 쓰는 단어들(don't/can't/I'm/You're/I'll/something's 등)은 아예 두 형태소로 분리되어 버려서 빈도 수로 봤을 때 의미를 해석하기 어려워졌다. 그리고 시제도 원형(going -> go)으로 확인해보려 했으나, 영어의 경우에는 의미를 유지하기 위해서 going 과 같은 변형들(동명사, 현재분사 등)은 그대로 두었다. 마찬가지로 wanna/gonna 도 그대로 두었다. 영어 단어별 빈도수 아래는 2020년도 Billboard 감정 분석 긍정/부정과 같은 감정 분석도 한번 해보고 싶은데, 글이 길어져서 별도의 글로 작성할 예정이다. 주제 분류 한국 가요(1964~2023)를 주제별로 모아보기 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노 blog.joonas.io 코드 GitHub - joonas-yoon/kpop-lyrics-analytics: 국내 가요 노랫말 분석 (1964~2023) 국내 가요 노랫말 분석 (1964~2023). Contribute to joonas-yoon/kpop-lyrics-analytics development by creating an account on GitHub. github.com 참고 From the dataisbeautiful community on Reddit: [OC] Word cloud made from the lyrics of every song that has hit the Billboard Hot Explore this post and more from the dataisbeautiful community www.reddit.com kiwipiepy API documentation (v0.16.2) Package kiwipiepy Kiwipiepy란? Kiwipiepy는 한국어 형태소 분석기인 Kiw 20 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 통계 NLP 한국노래 자연어 데이터분석 tf-idf 워드클라우드 pandas 가사분석 2024.01.26 블로그 검색 더보기 namu.wiki 사랑하기 때문에(노래) - 나무위키 1985년 4월 10일 발매된 조용필의 음반 《조용필 7집》의 수록곡. 작사 / 작곡 / 편곡 유재하. 가수 조용필 발매일 1985년 4월 10일(대한민국) 재생시간 4분 15초 장르 발라드 작사 유재하 개요 상세 가사 여담 커버(정식 리메이크 포함) 2024.05.17 웹문서 검색 더보기 駆け抜けるメドレーコラボレーションⅣ - 나무위키 반동사상문화배격법/적용 사례 - 나무위키 gasengi.com board 일본에서 가장 많이 리메이크된 외국곡은? 노래 중의 하나이고, 2020년대가 된 현재에도 일본에서 가장 많이 리메이크가 된 한국 노래이기도 하다. 또한, 지금도 일본 가라오케의 한국 가요 인기 순위에서도 항상 최상위권에 등록되어 있을 정도로 매우... 2024.05.06 v.daum.net 롱블랙 [롱블랙] 유튜브 누적 950억 뷰 '더핑크퐁컴퍼니', 대박은 운이 아닌 이 전략 덕분. - 콘텐츠뷰 만든다고 해볼까요? 아이들이 좋아하는 동물 순위부터 조사했어요. 키워드 검색량이 높은 순대로 노래를 만들었죠. 그렇게 만든 20곡짜리 동물 동요 중 하나가 아기상어였어요.” 전 세계를 휩쓴 베이비... 2024.04.13 전체보기 [뉴스에이드] 한국 노래 중 가장 긴 제목으로 컴백한 걸그룹 - 콘텐츠뷰 [피키캐스트] "국내 맞아요?" 롤러코스터보다 스릴 넘친다는 산책로의 실제 모습 - 콘텐츠뷰 fmkorea.com best "노래 언제끝나냐?" 러닝타임이 긴 노래들 - 포텐 터짐 최신순 - 에펨코리아 긴 노래들을 몇곡 소개해볼까 합니다. 러닝타임이 20분 언저리 이상 되는 곡들 중에서 개인적으로 인상깊게 들었던 곡들을 추려봤습니다. 말 그대로 개인적으로 인상깊게 들었던 곡들을 몇개만 추린거라 여러분들... 2024.05.17 전체보기 스압) M.C The Max의 히트곡과 숨겨진 명곡에 대해 알아보자 - 포텐 터짐 최신순 - 에펨코리아 몇 곡까지 알고 계신가요? Playlist 음악 추천 12편!! - 힙합 - 에펨코리아 inven.co.kr webzine news [인터뷰] 스토리상을 수상한 "헤븐 번즈 레드"의 현지화 이스 메모와르 -펠가나의 맹세- 애니멀 웰 세누아의 전설: 헬블레이드 2 브이라이징 하데스2 짱구는 못말려... 12 세상에서 가장 긴 이름을 가진 물고기인 '후무후무누쿠누쿠아푸아아'로 번역하여 원문의 의도를 살렸습니다. ▲ 직역: 자주 성의 해자에서 만나는구나 입을 뻐끔뻐끔 언제나 뻐끔뻐끔 미안 먹이는 안가지고 있어... 2024.02.07 전체보기 [인터뷰] 이팔청춘 그리고 음악 퍼포먼스를 담는 개발팀, '브릿지뮤직' 샌드랜드 스텔라 블레이드 백영웅전 키친 크라이시스 칠드런 오브 더 선 역붕괴: 베이커리작전... [인터뷰] 제노니아, "카툰렌더링 비주얼의 MMO 놀이터" 에일리언: 다크 디센트 레이어스오브피어 바인 파이널 판타지16 암네시아: 더 벙커 에테르 게이저 검은사막... 통합웹 더보기