Zaczynam wykonać ten kod:

URL = r"C:\Users\jarze\PycharmProjects\CSV-modifier\venv\html.html"
html_report_part1 = open(URL, 'r', encoding="UTF-8")
html_text = ''
for line in html_report_part1.readlines():
    html_text += line
soup = BeautifulSoup(html_text, "html.parser")

Plik jest w rzeczywistości dość duży (150 MB), ale kiedy otworzę go w Chrome, ładuje się szybko. Ten kod wykonywany jest na 5 godzin i nadal jest w toku. Czy jest coś, co mogę o tym zrobić?

0
Michał 24 lipiec 2020, 14:34

1 odpowiedź

Najlepsza odpowiedź

Bez dostępu do pliku twojego rozmiaru zastanawiam się, czy to daje lepszy wynik?:

URL = r"C:\Users\jarze\PycharmProjects\CSV-modifier\venv\html.html"
with open(URL, 'r', encoding="UTF-8") as f:
    soup = BeautifulSoup(r.read(), "html.parser")

Zasadniczo nie jesteś wszczęty przez pliki. Ale czytaj cały plik.

1
S.D. 24 lipiec 2020, 11:44