Obsługa danych w Pythonie – Wczytywanie i zapisywanie plików oraz parsowanie danych z różnych źródeł

Obsługa danych jest jednym z podstawowych zagadnień w każdym języku programowania, a Python jest w tym zakresie niezwykle elastyczny i pozwala na szybkie i łatwe przetwarzanie danych z różnych źródeł.
Wczytywanie i zapisywanie danych z/do plików
W Pythonie mamy kilka sposobów na wczytanie danych z pliku. Najprostszym sposobem jest użycie funkcji open()
, która pozwala otworzyć plik do odczytu lub zapisu. Następnie możemy wczytać zawartość pliku za pomocą metody read()
lub readlines()
. Poniższy przykład ilustruje, jak wczytać całą zawartość pliku do zmiennej:
with open('plik.txt', 'r') as f:
zawartosc = f.read()
Jeśli chcemy wczytać plik linia po linii, możemy użyć pętli for
:
with open('plik.txt', 'r') as f:
for linia in f:
print(linia)
Zapisywanie danych do pliku jest równie proste. Możemy użyć tej samej funkcji open()
, ale tym razem otwieramy plik do zapisu za pomocą parametru 'w'
lub do dopisywania do istniejącego pliku za pomocą parametru 'a'
. Poniższy przykład ilustruje, jak zapisać dane do pliku:
with open('plik.txt', 'w') as f:
f.write('To jest nowa zawartość pliku')
Parsowanie i przetwarzanie danych z różnych źródeł
Czasem dane, które chcemy przetwarzać, zapisane są w specjalnym formacie, np. pliku CSV (Comma Separated Values) lub JSON (JavaScript Object Notation). W takich przypadkach możemy skorzystać z odpowiednich bibliotek, które umożliwiają szybkie i łatwe parsowanie takich danych.
Pliki CSV to pliki tekstowe, w których poszczególne pola danych są oddzielone przecinkami. Możemy wczytać taki plik za pomocą modułu csv
:
import csv
with open('dane.csv', 'r') as f:
reader = csv.reader(f)
for row in reader:
print(row)
Pliki JSON to pliki tekstowe zapisane w formacie podobnym do obiektów w języku JavaScript. Możemy wczytać taki plik za pomocą funkcji json.load()
z modułu json
:
import json
with open('dane.json', 'r') as f:
dane = json.load(f)
print(dane)
Oprócz wczytywania danych z plików, Python pozwala również na łatwe przetwarzanie danych z sieci. Możemy np. wczytać dane z API (Application Programming Interface) za pomocą modułu requests
. Poniższy przykład ilustruje, jak wczytać dane z API za pomocą modułu requests
i zapisać je do pliku JSON:
import requests
import json
URL = 'https://api.example.com/dane'
response = requests.get(URL)
dane = response.json()
with open('dane.json', 'w') as f:
json.dump(dane, f)
Tekst wygenerowany przy pomocy chat.openai.com.