インストール

Beautifulsoupとurllibをインストールしましょう。

pip3 install beautifulsoup
pip3 install urllib3

インポート

次にインストールしたモジュールをインポートします。

# coding: UTF-8
import urllib.request, urllib.error
from bs4 import BeautifulSoup

つづいて、htmlを取得したいurlを指定します。今回は日本経済新聞のウェブサイトを指定します。
そのあとにBeautifulSoupで扱える形にします。

url = "https://www.nikkei.com/"
html = urllib.request.urlopen(url)
soup = BeautifulSoup(html, 'html.parser')

このsoupには、全htmlが格納されています。

いよいよ、情報を取得していきます。

soup.find("head").find("title") 
もしくは
soup.find("title")

soup.find("body").find("h1")
もしくは
soup.find("h1")

#textを取得
soup.find("body").find("h1").text

上記の場合、最初に出てきたタグしか出てこない。なので、すべてのタグを取得するには以下のように書く

soup.find_all("h1")

#リストとして取得するには[]で囲む
h1s = soup.find_all(["h1"])

#テキストを取得するにはforで回す
h1s = soup.find_all(["h1"])
for h1 in h1s:
 print(h1.text)