본문 바로가기
-------------코딩-------------/Python 기초 코딩

네이버 인기검색어 크롤링

by 탶선 2020. 10. 19.
반응형

from urllib.request import urlopen
from bs4 import BeautifulSoup
from html2text import html2text
import pprint

if __name__ == "__main__":

url = urlopen("https://www.naver.com/")
bs = BeautifulSoup(url,'html.parser')
rank = bs.find_all('span',class_='ah_k')

list = []
dic = {}

for val in rank:
list.append(html2text(str(val)).replace("\n","",2))

for n in range(0,20):
dic[n+1] = list[n]

dic = pprint.pprint(dic)

반응형

댓글