Подтвердить что ты не робот

Неопределенности в Пандах

Как легко обрабатывать неопределенности в Series или DataFrame в Pandas (библиотека анализа данных Python)? Недавно я обнаружил пакет неопределенностей Python, но мне интересно, есть ли какой-нибудь более простой способ управления неопределенностями непосредственно в Pandas. Я не нашел ничего об этом в документации.

Чтобы быть более точным, я не хочу хранить неопределенности как новый столбец в моем DataFrame, потому что я думаю, что они являются частью ряда данных и не должны быть логически отделены от него. Например, не имеет смысла удалять столбец в DataFrame, но не его неопределенности, поэтому я должен обработать этот случай вручную.

Я искал что-то вроде data_frame.uncertainties которое могло бы работать как атрибут data_frame.values. data_frame.units (для блоков данных) тоже был бы data_frame.units но я думаю, что таких вещей в Пандах нет (пока?)...

4b9b3361

Ответ 1

Если вы действительно хотите, чтобы это была встроенная функция, вы можете просто создать класс для размещения вашего фрейма данных. Затем вы можете определить любые значения или функции, которые вы хотите. Ниже я написал быстрый пример, но вы можете легко добавить определение единиц или более сложную формулу неопределенности

import pandas as pd

data={'target_column':[100,105,110]}

class data_analysis():
    def __init__(self, data, percentage_uncertainty):
    self.df = pd.DataFrame(data)
    self.uncertainty = percentage_uncertainty*self.df['target_column'].values

Когда я бегу

example=data_analysis(data,.01)
example.uncertainty

Я получаю массив ([1., 1.05, 1.1])

Надеюсь это поможет