Подтвердить что ты не робот

Как пропустить пустые даты (выходные) в финансовом графике Matplotlib Python?

ax.plot_date((dates, dates), (highs, lows), '-')

В настоящее время я использую эту команду для построения финансовых максимумов и минимумов с помощью Matplotlib. Он отлично работает, но как удалить пробелы по оси x, оставленные днями без рыночных данных, таких как выходные и праздничные дни?

У меня есть списки дат, максимумов, минимумов, закрытий и открытий. Я не могу найти примеров создания графика с осью х, которая показывает даты, но не обеспечивает постоянный масштаб.

4b9b3361

Ответ 1

Я думаю, вам нужно "искусственно синтезировать" точную форму сюжета, которую вы хотите, используя xticks, чтобы установить метки тика на строки, представляющие даты (конечно, помещая тики в равные интервалы, даже если даты, re-представление не равно), а затем с помощью простой plot.

Ответ 3

Одной из рекламируемых функций scikits.timeseries является "Создание графиков временных рядов с интеллектуально разнесенными метками осей".

Вы можете увидеть некоторые примеры графиков здесь. В первом примере (показанном ниже) частота "бизнес" используется для данных, что автоматически исключает праздничные и выходные дни и тому подобное. Он также маскирует пропущенные точки данных, которые вы видите на этом графике как пропуски, вместо линейной интерполяции их.

alt text

Ответ 4

Я обычно использую NumPy NaN (а не число) для недопустимых или отсутствующих значений. Они представлены Matplotlib как пробелы в сюжете, а NumPy является частью pylab/Matplotlib.

>>> import pylab
>>> xs = pylab.arange(10.) + 733632. # valid date range
>>> ys = [1,2,3,2,pylab.nan,2,3,2,5,2.4] # some data (one undefined)
>>> pylab.plot_date(xs, ys, ydate=False, linestyle='-', marker='')
[<matplotlib.lines.Line2D instance at 0x0378D418>]
>>> pylab.show()

Ответ 5

Обновленный ответ (2018) с Matplotlib 2.1.2, Python 2.7.12

Функция equidate_ax обрабатывает все, что вам нужно для простой оси X с одинаковым расстоянием между точками данных. Реализовано с помощью ticker.FuncFormatter на основе этого примера.

from __future__ import division
from matplotlib import pyplot as plt
from matplotlib.ticker import FuncFormatter
import numpy as np
import datetime


def equidate_ax(fig, ax, dates, fmt="%Y-%m-%d", label="Date"):
    """
    Sets all relevant parameters for an equidistant date-x-axis.
    Tick Locators are not affected (set automatically)

    Args:
        fig: pyplot.figure instance
        ax: pyplot.axis instance (target axis)
        dates: iterable of datetime.date or datetime.datetime instances
        fmt: Display format of dates
        label: x-axis label
    Returns:
        None

    """    
    N = len(dates)
    def format_date(index, pos):
        index = np.clip(int(index + 0.5), 0, N - 1)
        return dates[index].strftime(fmt)
    ax.xaxis.set_major_formatter(FuncFormatter(format_date))
    ax.set_xlabel(label)
    fig.autofmt_xdate()


#
# Some test data (with python dates)
#
dates = [datetime.datetime(year, month, day) for year, month, day in [
    (2018,2,1), (2018,2,2), (2018,2,5), (2018,2,6), (2018,2,7), (2018,2,28)
]]
y = np.arange(6)


# Create plots. Left plot is default with a gap
fig, [ax1, ax2] = plt.subplots(1, 2)
ax1.plot(dates, y, 'o-')
ax1.set_title("Default")
ax1.set_xlabel("Date")


# Right plot will show equidistant series
# x-axis must be the indices of your dates-list
x = np.arange(len(dates))
ax2.plot(x, y, 'o-')
ax2.set_title("Equidistant Placement")
equidate_ax(fig, ax2, dates)

Comparison of default plotting method and equidistant x-axis

Ответ 6

Я снова столкнулся с этой проблемой и смог создать приличную функцию для решения этой проблемы, особенно в отношении внутридневных дат. Благодарим @Primer за этот ответ.

def plot_ts(ts, step=5, figsize=(10,7), title=''):
    """
    plot timeseries ignoring date gaps

    Params
    ------
    ts : pd.DataFrame or pd.Series
    step : int, display interval for ticks
    figsize : tuple, figure size
    title: str
    """

    fig, ax = plt.subplots(figsize=figsize)
    ax.plot(range(ts.dropna().shape[0]), ts.dropna())
    ax.set_title(title)
    ax.set_xticks(np.arange(len(ts.dropna())))
    ax.set_xticklabels(ts.dropna().index.tolist());

    # tick visibility, can be slow for 200,000+ ticks 
    xticklabels = ax.get_xticklabels() # generate list once to speed up function
    for i, label in enumerate(xticklabels):
        if not i%step==0:
            label.set_visible(False)  
    fig.autofmt_xdate()   

Ответ 7

Функциональность scikits.timeseries была в основном перенесена в pandas, поэтому теперь вы можете повторно формировать образец данных, чтобы включить значения только в рабочие дни.

>>>import pandas as pd
>>>import matplotlib.pyplot as plt

>>>s = pd.Series(list(range(10)), pd.date_range('2015-09-01','2015-09-10'))
>>>s

2015-09-01    0
2015-09-02    1
2015-09-03    2
2015-09-04    3
2015-09-05    4
2015-09-06    5
2015-09-07    6
2015-09-08    7
2015-09-09    8
2015-09-10    9

>>> s.resample('B', label='right', closed='right').last()
2015-09-01    0
2015-09-02    1
2015-09-03    2
2015-09-04    3
2015-09-07    6
2015-09-08    7
2015-09-09    8
2015-09-10    9

а затем построить график данных как обычно

s.resample('B', label='right', closed='right').last().plot()
plt.show()