Подтвердить что ты не робот

Конкатенация разреженных матриц в Python с использованием SciPy/Numpy

Каким будет наиболее эффективный способ конкатенации разреженных матриц в Python с помощью SciPy/Numpy?

Здесь я использовал следующее:

>>> np.hstack((X, X2))
array([ <49998x70000 sparse matrix of type '<class 'numpy.float64'>'
        with 1135520 stored elements in Compressed Sparse Row format>,
        <49998x70000 sparse matrix of type '<class 'numpy.int64'>'
        with 1135520 stored elements in Compressed Sparse Row format>], 
       dtype=object)

Я хотел бы использовать оба предиктора в регрессии, но текущий формат, очевидно, не является тем, что я ищу. Можно ли получить следующее:

    <49998x1400000 sparse matrix of type '<class 'numpy.float64'>'
     with 2271040 stored elements in Compressed Sparse Row format>

Он слишком велик, чтобы преобразовать его в глубокий формат.

4b9b3361

Ответ 1

Вы можете использовать scipy.sparse.hstack:

from scipy.sparse import hstack
hstack((X, X2))

Использование numpy.hstack создаст массив с двумя разреженными матричными объектами.