支持的 Python 数据结构
此页面是各种输入类型的支持矩阵。
标记
T:支持。
F:不支持。
NE:对于此用例,类型无效。例如,
pandas.Series
不能作为多目标标签。NPA:借助 numpy 数组支持。
AT:借助 arrow table 支持。
CPA:借助 cupy 数组支持。
SciCSR:借助 scipy 稀疏 CSR
scipy.sparse.csr_matrix
支持。转换为 scipy CSR 可能成功也可能不成功。如果转换失败,则引发类型错误。FF:如果需要,我们期待在不久的将来支持它。
empty:待填写。
表头
X 表示预测矩阵。
元信息:标签、权重等。
多标签:用于多目标的 2 维标签。
其他:此处未明确列出的任何其他内容,包括 lil、dia、bsr 等格式。XGBoost 将尝试将其转换为 scipy csr。
支持矩阵
名称 |
DMatrix X |
QuantileDMatrix X |
Sklearn X |
元信息 |
原地预测 |
多标签 |
---|---|---|---|---|---|---|
numpy.ndarray |
T |
T |
T |
T |
T |
T |
scipy.sparse.csr |
T |
T |
T |
NE |
T |
F |
scipy.sparse.csc |
T |
F |
T |
NE |
F |
F |
scipy.sparse.coo |
SciCSR |
F |
SciCSR |
NE |
F |
F |
uri |
T |
F |
F |
F |
NE |
F |
list |
NPA |
NPA |
NPA |
NPA |
NPA |
T |
tuple |
NPA |
NPA |
NPA |
NPA |
NPA |
T |
pandas.DataFrame |
NPA |
NPA |
NPA |
NPA |
NPA |
NPA |
pandas.Series |
NPA |
NPA |
NPA |
NPA |
NPA |
NE |
cudf.DataFrame |
T |
T |
T |
T |
T |
T |
cudf.Series |
T |
T |
T |
T |
FF |
NE |
cupy.ndarray |
T |
T |
T |
T |
T |
T |
torch.Tensor |
T |
T |
T |
T |
T |
T |
dlpack |
CPA |
CPA |
CPA |
FF |
FF |
|
modin.DataFrame |
NPA |
FF |
NPA |
NPA |
FF |
|
modin.Series |
NPA |
FF |
NPA |
NPA |
FF |
|
pyarrow.Table |
T |
T |
T |
T |
T |
T |
polars.DataFrame |
AT |
AT |
AT |
AT |
AT |
AT |
polars.LazyFrame (WARN) |
AT |
AT |
AT |
AT |
AT |
AT |
polars.Series |
AT |
AT |
AT |
AT |
AT |
NE |
__array__ |
NPA |
F |
NPA |
NPA |
H |
|
其他 |
SciCSR |
F |
F |
F |
polars LazyFrame.collect
支持多种配置,从查询引擎的选择到类型强制。XGBoost 简单地使用默认参数。请在将其传递给 XGBoost 之前运行 collect
以获取 DataFrame
,以便更好地控制行为。