고객지원
차별화된 온실을 건축하고 고객과 함께 성장하는 착한기업 주식회사 하임원예건축 건축사사무소입니다.
  >  고객지원  >  고객지원

5분이면 뚝딱 만드는 워드클라우드 글자=>이미지

페이지 정보

작성자 Dana 작성일24-11-17 14:53 조회8회 댓글0건

본문

1. 워드클라우드 기본 패키지 설치아래 코드를 실행해 워드클라우드에 필요한 패키지를 설치하자어디에 설치되는지 위치 확인하시길!혹시라도 anaconda3에 설치되지 않고 python경로에 설치가 된다면 따로 import를 해줘야 한다​2. 원하는 워드클라우드 단어를 검색하는 뉴스 URL 생성​이건 HTTP를 가져오기 위한 라이브러리그 후 내가 선택한 검색어를 검색하는 url을 입력한다.이 때 url은 반드시!! UTF-8로 인코딩되어야 함생성을 하게 워드클라우드 되면 입력한 단어를 검색하는 링크가 생성됨여기서는 '안녕'이라는 단어를 입력함!​​3. 정적 HTML 가져온 뒤 원하는 데이터 파싱​1) 원하는 데이터를 파싱하는 라이브러리인 BeautifulSoup를 임포트 후 워드클라우드 인스턴스를 생성한다2) 선택자 찾기(1) 위에서 구한 target_url에 들어간 후 개발자 도구 열기(2) 개발자 도구에서 아래 아이콘 클릭 후 크롤링하고 싶은 곳 클릭(3) 아래 워드클라우드 그림처럼 클릭한 곳의 HTML 코드가 나오게 되는데 이 부분 우클릭 -&gtCopy -&gtCopy selector 순으로 작업하면 선택자 코드가 복사됨!여기서는이 부분을 가져왔고, 선택자는 #contents &gtdiv 워드클라우드 &gtdiv &gtdiv.divide_area &gtsection &gtdiv.sch_tab &gtul &gtli.tab_list_node.is_active &gtbutton &gta &gtspan이렇게 나오는데 맨 끝에 있는 button &gta &gtspan만 가져와서 사용했다​3) 전체 기사 개수 찾아오기4) 읽어올 워드클라우드 데이터 개수 입력 받아 읽어올 페이지의 개수(page_num) 생성하기​4. 텍스트 파일 생성 후 파싱한 데이터(기사 링크) 저장여기까지 하면 C:\Users\USER 경로에 '(내가입력한검색어).txt'파일이 생성된다!안녕​5. 텍스트 파일에서 워드클라우드 명사(한글 형태로 분석) 추출​1) 한국어 형태소 분석기인 Kkma를 사용해 추출하기2) 검색어가 포함된 기사 찾기​6. 워드클라우드 생성실행 결과는 다음과 같다! 읽어오는 데이터 개수마다 실행 워드클라우드 결과가 다르게 나올 것이다신기하당​

댓글목록

등록된 댓글이 없습니다.

주식회사 하임원예건축 건축사사무소  |  대표자 김진국  | 사업자등록번호 377-88-00723  |  TEL 033-241-8683  |  FAX 033-241-9749  
ADD 강원도 춘천시 퇴계로93번길 4-8 이삭빌딩 503호
E-mail visionkjkj@naver.com  |   Copyrightsⓒ2019 (주)하임원예건축 All rights reserved.  |  개인정보처리방침