검색 본문
blog.joonas.io Joonas' Note 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 정말 영어가 많아졌는가? 마침 1964년부터 2023년까지 60년의 데이터가 쌓였고, 결론부터 말하자면 영어 비중은 많아졌다. 1964~2023년 연도별 한글/영어 가사 비율 2023년에 들어서는 영어 가사의 비중이 25% 를 넘을 정도로 많아졌고, 최근에 사람들이 이런 사실을 체감하는 이유는 2011년 이후로 10년만에 영어 비율이 더 커지고 있기 때문으로 보인다. 영어 비중은 2008~2012년 사이에 잠시 상승하고 그 뒤로는 오히려 줄어들더니, 2018년부터 다시 상승한다.2018년에는 BTS가 FAKE LOVE로 빌보드 TOP 10에 처음으로 진입 한국어 가사 분석 형태소 분석기 선택 한국어 형태소 분석에는 여러 라이브러리가 있는데, 처음에 KoNLPy 로 해봤다가 자바 경로 설정 문제가 있어서 다른 걸 알아보던 중, Kiwi가 형용사나 보조 용언 쪽에서 품사 태그를 더 자세히 분류하고 API도 간단해보여서 중간에 Kiwi로 변경했다. (좌) KoNLPy 동사 추출, (우) Kiwi 동사 추출 여담으로 KIWI 개발자 블로그가 있길래 형태소 분석기가 어떤 원리로 개발되었는지 글이 있어서 읽어봤는데 무척 흥미로웠다.관심 있는 사람은 https://bab2min.tistory.com/560 글 국내 가요 내 영단어들 단수/복수형은 어느정도 처리된 것 같은데, 아무래도 apostrophe(')를 쓰는 단어들(don't/can't/I'm/You're/I'll/something's 등)은 아예 두 형태소로 분리되어 버려서 빈도 수로 봤을 때 의미를 해석하기 어려워졌다. 그리고 시제도 원형(going -> go)으로 확인해보려 했으나, 영어의 경우에는 의미를 유지하기 위해서 going 과 같은 변형들(동명사, 현재분사 등)은 그대로 두었다. 마찬가지로 wanna/gonna 도 그대로 두었다. 영어 단어별 빈도수 아래는 2020년도 Billboard 감정 분석 긍정/부정과 같은 감정 분석도 한번 해보고 싶은데, 글이 길어져서 별도의 글로 작성할 예정이다. 주제 분류 한국 가요(1964~2023)를 주제별로 모아보기 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노 blog.joonas.io 코드 GitHub - joonas-yoon/kpop-lyrics-analytics: 국내 가요 노랫말 분석 (1964~2023) 국내 가요 노랫말 분석 (1964~2023). Contribute to joonas-yoon/kpop-lyrics-analytics development by creating an account on GitHub. github.com 참고 From the dataisbeautiful community on Reddit: [OC] Word cloud made from the lyrics of every song that has hit the Billboard Hot Explore this post and more from the dataisbeautiful community www.reddit.com kiwipiepy API documentation (v0.16.2) Package kiwipiepy Kiwipiepy란? Kiwipiepy는 한국어 형태소 분석기인 Kiw 20 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 통계 NLP 한국노래 자연어 데이터분석 tf-idf 워드클라우드 pandas 가사분석 2024.01.26 블로그 검색 더보기 namu.wiki 사랑하기 때문에(노래) - 나무위키 1985년 4월 10일 발매된 조용필의 앨범 조용필 7집의 수록곡. 작사 / 작곡 / 편곡 유재하. 발매 1985년 4월 10일(대한민국) 작사 유재하 편곡 조용필 길이 4분 15초 개요 상세 가사 여담 커버(정식 리메이크 포함) 2024.03.16 웹문서 검색 더보기 駆け抜けるメドレーコラボレーションⅣ - 나무위키 나무위키:제목이 긴 문서 - 나무위키 v.daum.net 뉴스에이드 [뉴스에이드] 한국 노래 중 가장 긴 제목으로 컴백한 걸그룹 - 콘텐츠뷰 54자다. 현재까지 발표된 국내 가요 중 가장 긴 제목이라고. 섞이기 힘든 음이 만나 유니크하면서...한다. 참고로 '7도'여서인지 지난 7일에 노래가 나왔다. KBS 2TV: 더블V (송은이X김숙... 2020.07.10 전체보기 [롱블랙] 유튜브 누적 950억 뷰 '더핑크퐁컴퍼니', 대박은 운이 아닌 이 전략 덕분. - 콘텐츠뷰 [피키캐스트] "국내 맞아요?" 롤러코스터보다 스릴 넘친다는 산책로의 실제 모습 - 콘텐츠뷰 inven.co.kr webzine news [인터뷰] 스토리상을 수상한 "헤븐 번즈 레드"의 현지화 샌드랜드 스텔라 블레이드 백영웅전 키친 크라이시스 칠드런 오브 더 선 역붕괴: 베이커리작전 라이즈 오브 더... 12 세상에서 가장 긴 이름을 가진 물고기인 '후무후무누쿠누쿠아푸아아'로 번역하여 원문의 의도를 살렸습니다. ▲ 직역: 자주 성의 해자에서 만나는구나 입을 뻐끔뻐끔 언제나 뻐끔뻐끔 미안 먹이는 안가지고 있어... 2024.02.07 전체보기 [인터뷰] 이팔청춘 그리고 음악 퍼포먼스를 담는 개발팀, '브릿지뮤직' 샌드랜드 스텔라 블레이드 백영웅전 키친 크라이시스 칠드런 오브 더 선 역붕괴: 베이커리작전... [인터뷰] 제노니아, "카툰렌더링 비주얼의 MMO 놀이터" 에일리언: 다크 디센트 레이어스오브피어 바인 파이널 판타지16 암네시아: 더 벙커 에테르 게이저 검은사막... melon.com musicstory informview Special이달의 아티스트: 옥상달빛 주제인데요. 제목은 이어령 씨의 책을 보고 위로가 되어 적어 둔 문장이에요. 제가 이런 말을 듣고 싶었더라고요. 그리고 무겁지만 이런 말을 원하는 누군가 있지 않을까 싶었고요. 죽음에 대해 가까이 생각하는... 2024.05.02 전체보기 이달의 아티스트: 김수영 약속의 봄, 5년 만에 돌아온 노리플라이 (no reply) '랑데뷰 (Rendezvous)' artinsight.co.kr news view [Opinion] 저항을 노래하다. [음악] 살던 중, 서울문리대 신입회 환영회 공연에서 부른 꽃피우는 아이가 불온하다는 이유로 동대문 경찰서로...김민기는 1971년 양희은의 고운노래모음 1집에 수록된 김민기 작곡노래들을 모두 금지곡으로 지정... 2023.11.21 전체보기 [Opinion] 데이식스가 전하는 7가지 고백 [음악] [ART insight] 글, 나의 사유를 펼치는 도화지 통합웹 더보기