반응형
from urllib.request import urlopen
from bs4 import BeautifulSoup
from html2text import html2text
import pprint
if __name__ == "__main__":
url = urlopen("https://www.naver.com/")
bs = BeautifulSoup(url,'html.parser')
rank = bs.find_all('span',class_='ah_k')
list = []
dic = {}
for val in rank:
list.append(html2text(str(val)).replace("\n","",2))
for n in range(0,20):
dic[n+1] = list[n]
dic = pprint.pprint(dic)
반응형
'-------------코딩------------- > Python 기초 코딩' 카테고리의 다른 글
네이버 주식 크롤링 (0) | 2020.11.02 |
---|---|
ValueError: invalid literal for int() with base10: ' ' (0) | 2020.10.19 |
트위터 전처리 (0) | 2020.08.04 |
트위터 크롤링 (0) | 2020.07.28 |
네이버 증권뉴스 크롤링(2) (0) | 2020.07.27 |
댓글