支持的 Python 数据结构

此页面是各种输入类型的支持矩阵。

标记

  • T:支持。

  • F:不支持。

  • NE:对于此用例,类型无效。例如,pandas.Series 不能作为多目标标签。

  • NPA:借助 numpy 数组支持。

  • AT:借助 arrow table 支持。

  • CPA:借助 cupy 数组支持。

  • SciCSR:借助 scipy 稀疏 CSR scipy.sparse.csr_matrix 支持。转换为 scipy CSR 可能成功也可能不成功。如果转换失败,则引发类型错误。

  • FF:如果需要,我们期待在不久的将来支持它。

  • empty:待填写。

表头

  • X 表示预测矩阵。

  • 元信息:标签、权重等。

  • 多标签:用于多目标的 2 维标签。

  • 其他:此处未明确列出的任何其他内容,包括 lildiabsr 等格式。XGBoost 将尝试将其转换为 scipy csr。

支持矩阵

名称

DMatrix X

QuantileDMatrix X

Sklearn X

元信息

原地预测

多标签

numpy.ndarray

T

T

T

T

T

T

scipy.sparse.csr

T

T

T

NE

T

F

scipy.sparse.csc

T

F

T

NE

F

F

scipy.sparse.coo

SciCSR

F

SciCSR

NE

F

F

uri

T

F

F

F

NE

F

list

NPA

NPA

NPA

NPA

NPA

T

tuple

NPA

NPA

NPA

NPA

NPA

T

pandas.DataFrame

NPA

NPA

NPA

NPA

NPA

NPA

pandas.Series

NPA

NPA

NPA

NPA

NPA

NE

cudf.DataFrame

T

T

T

T

T

T

cudf.Series

T

T

T

T

FF

NE

cupy.ndarray

T

T

T

T

T

T

torch.Tensor

T

T

T

T

T

T

dlpack

CPA

CPA

CPA

FF

FF

modin.DataFrame

NPA

FF

NPA

NPA

FF

modin.Series

NPA

FF

NPA

NPA

FF

pyarrow.Table

T

T

T

T

T

T

polars.DataFrame

AT

AT

AT

AT

AT

AT

polars.LazyFrame (WARN)

AT

AT

AT

AT

AT

AT

polars.Series

AT

AT

AT

AT

AT

NE

__array__

NPA

F

NPA

NPA

H

其他

SciCSR

F

F

F

polars LazyFrame.collect 支持多种配置,从查询引擎的选择到类型强制。XGBoost 简单地使用默认参数。请在将其传递给 XGBoost 之前运行 collect 以获取 DataFrame,以便更好地控制行为。