업무 자동화 ㅣ 원하는 메시지 스크랩

파이썬을 이용한 업무 자동화 방법 아래에서 원하는 메시지를 스크래칭하는 방법을 배웠습니다. 단계를 순서대로 따르면 원하는 메시지를 원하는대로 긁을 수 있습니다. 프로그래밍을 처음 배워서 배운 내용을 정리하고 기록하기 위해 이 글을 씁니다.

쉬운 목차

뉴스 검색 페이지로 이동

원하는 메시지가 있는 검색 페이지로 이동합니다. 검색창에 원하는 검색어를 입력 후 검색 후 (우클릭) – (조사)를 클릭하면 아래와 같은 화면이 나타납니다.

'추천 관련글,

오른쪽 화면에서 마크를 찾으면 검색창에 검색한 단어가 포함됩니다. 다른 단어로 변경하면 왼쪽 검색창에 기존 검색어가 표시되고 변경한 단어로 대체됩니다. 단어를 변경한다고 해서 변경한 단어가 다른 사람에게 표시되는 것은 아닙니다. 하지만 수신된 데이터만 처리했기 때문에 다르게 보일 뿐입니다.

즉, 이미 가지고 있는 정보를 솎아냄으로써 원하는 정보만 긁어내는 것이 가능하다. 크롤링의 기본 코드는 다음과 같습니다. 복사하여 붙여넣은 후 메시지 스크랩을 시작하겠습니다.

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query=삼성전자',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')