Tip & Tech/Internet tip

단어의 연도별 사용 수를 알려주는 구글 엔그램 뷰어

dorudoru 2022. 1. 8. 14:38

구글 엔그램

엔그램

구글에서 출시한 서비스로 구글이 1500년대부터 스캔한 3000만권의 책 중

약 800만개의 책에서 원하는 단어의 빈도를 찾아주는 프로그램입니다.

아쉽게도 한글은 지원하지 않습니다.

구글 엔그램 뷰어(Google Ngram Viewer) 또는 구글 북스 엔그램 뷰어(Google Books Ngram Viewer)는 영어, 중국어(간체), 프랑스어, 독일어, 히브리어, 이탈리아어, 러시아어, 스페인어로 된 구글의 말뭉치에서 1500년부터 2019년 사이 인쇄된 출전에서 발견되는 연간 n-gram의 수를 이용하여 일련의 검색 문자열의 주기를 도표화하는 온라인 검색 엔진이다. 미국 영어, 영국 영어, 영어 픽션 등 일부 특수한 영어 말뭉치도 존재한다.

이 프로그램은 오철자나 이치에 맞지 않는 단어나 구를 검색할 수 있다. n-gram은 선택된 말뭉치 내에서 텍스트와 매칭이 되며 선택적으로 철자의 대소문자 구별이 가능하며 40개 이상의 서적에서 발견되는 경우 그래프로 표출된다.

구글 엔그램 뷰어는 품사와 와일드카드 검색을 지원한다. 이는 검색에 주로 사용된다.

구글 사이트에 들어가면 확인이 가능합니다.

https://books.google.com/ngrams

 

Google Books Ngram Viewer

Google Books Ngram Viewer

books.google.com

첫페이지는 아이슈타인과 셜록홈즈, 프랑켄 슈타인이 나옵니다!

구글 엔그램

이를 통해서 트렌트를 유추할 수 있는데요.

빅데이터와 메타버스를 검색해보면, 빅데이터는 지는 해이고, 메타버스는 뜨는 해임을 알 수 있습니다.

메타버스 빅데이터

하단에 버튼을 누르면 그 해당하는 도서를 구글 북스에서 찾아줍니다.

역시 구글의 빅데이터는 무섭네요.

영어 외에도 다양한 언어를 지원하니 원하는 단어의 트렌드를 유추해볼 수 있습니다.

요즘 핫한 인플루엔자와 백신에 대한 키워드도 아래와 같이 비교해볼 수 있습니다.

키워드

이처럼 다양한 검색을 해볼 수 있는데요.

2021.11.04 - [Tip & Tech/IT] - 메타버스는 헛소리인가?

 

메타버스는 헛소리인가?

최근 칼럼이 인기를 끌고 있는데요. 바로 Metaverse is bullshit(메타버스는 헛소리다)라는 칼럼입니다. 둠, 퀘이크 등 게임 개발자로 유명한 존 카맥이 메타버스에 대해서 부정적인 언급을 한 뒤에 나

dorudoru.tistory.com

예전에 포스팅한 메타버스에 대해서도 한번 검색해보면 아직 조금 유사한 느낌인

ar이라던지, 3d와 비교해보면 이제 단어가 시작되는 상황으로 판단됩니다.

메타버스

생각보다 단어의 추적을 통해서 시대의 변화상 등을 확인할 수 있는데요.

예를 들어 자동차 회사 gm, ford, tesla 등을 검색해보면 아래와 같은 트렌드를 분석할 수 있습니다

자동차회사

또 소니와 삼성 닌텐도에 단어 추이를 살펴보면

Sony의 경우 1946년에 설립되었다는데요. 왜 이렇게 많이 검색되는지 모르겠습니다.

사전을 찾아보니 젊은이라는 표현이 있다고 하는데요.

그래서 이렇게 많이 검색되나 봅니다,

구글 ngram을 통해서 

원하는 단어의 트렌드에 대해서 한번 검색해보시기 바랍니다.

728x90