Сохранение и загрузка массивов в NumPy

Сохранение в файл и загрузка массивов в NumPy

Одна из важных функциональных возможностей любой библиотеки для работы с данными — это возможность эффективно загружать и сохранять данные. NumPy предоставляет несколько удобных функций для этой цели, а именно: load(), save(), loadtxt(), и savetxt().

Бинарный формат: .npy и .npz

Функции save() и load() в NumPy используются для сохранения и загрузки данных в бинарном формате.

import numpy as np

# Создание массива
arr = np.array([[1, 2, 3], [4, 5, 6]])

# Сохранение массива
np.save('array_data.npy', arr)

# Загрузка массива
loaded_arr = np.load('array_data.npy')
print(loaded_arr)

Преимущества бинарного формата:

  • Быстрое сохранение и загрузка.
  • Меньший размер файла по сравнению с текстовыми форматами.

Для сохранения нескольких массивов используется формат .npz:

arr2 = np.array([0.1, 0.2, 0.3])
np.savez('arrays_data.npz', arr1=arr, arr2=arr2)

data = np.load('arrays_data.npz')
print(data['arr1'])
print(data['arr2'])

Текстовый формат

Функции savetxt() и loadtxt() используются для сохранения и загрузки массивов в текстовом формате.

# Сохранение массива в CSV
np.savetxt('array_data.csv', arr, delimiter=',')

# Загрузка массива из CSV
loaded_arr_csv = np.loadtxt('array_data.csv', delimiter=',')
print(loaded_arr_csv)

Преимущества текстового формата:

  • Человеко-читаемый.
  • Легко импортировать в другие системы или программы.

Однако стоит учесть, что текстовые форматы обычно занимают больше места, и операции загрузки/сохранения могут быть медленнее по сравнению с бинарными форматами.

Заключение

Возможности NumPy по сохранению и загрузке данных делают его еще более универсальным инструментом. Благодаря этому, пользователи могут легко сохранять свои результаты для последующего использования или обмена данными с другими пользователями или приложениями. При правильном использовании этих функций вы можете значительно упростить процесс работы с данными, ускорить свою работу и сделать ее более эффективной.

Содержание: