操作器

将数据摄取到 Pinecone 索引中

使用 PineconeIngestOperator 与 Pinecone API 交互以摄取向量。

使用操作器

PineconeIngestOperator 需要将 vectors 作为输入摄取到 Pinecone 中。使用 conn_id 参数指定用于连接到您的帐户的 Pinecone 连接。向量还可以包含引用与向量相对应的原始文本的元数据,这些元数据可以被摄取到数据库中。

以下是以这种方式使用操作器的示例

tests/system/providers/pinecone/example_dag_pinecone.py[源代码]

PineconeIngestOperator(
    task_id="pinecone_vector_ingest",
    index_name=index_name,
    input_vectors=[
        ("id1", [1.0, 2.0, 3.0], {"key": "value"}),
        ("id2", [1.0, 2.0, 3.0]),
    ],
    namespace=namespace,
    batch_size=1,
)

创建基于 Pod 的索引

使用 CreatePodIndexOperator 与 Pinecone API 交互以创建基于 Pod 的索引。

使用操作器

CreatePodIndexOperator 需要索引详细信息以及 Pod 配置详细信息。api_keyenvironment 可以通过参数传递给操作器,也可以通过连接传递。

以下是以这种方式使用操作器的示例

tests/system/providers/pinecone/example_create_pod_index.py[源代码]

# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
CreatePodIndexOperator(
    task_id="pinecone_create_pod_index",
    index_name=index_name,
    dimension=3,
    replicas=1,
    shards=1,
    pods=1,
    pod_type="p1.x1",
)

创建无服务器索引

使用 CreateServerlessIndexOperator 与 Pinecone API 交互以创建基于 Pod 的索引。

使用操作器

CreateServerlessIndexOperator 需要索引详细信息以及无服务器配置详细信息。api_keyenvironment 可以通过参数传递给操作器,也可以通过连接传递。

以下是以这种方式使用操作器的示例

tests/system/providers/pinecone/example_create_serverless_index.py[源代码]

# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
CreateServerlessIndexOperator(
    task_id="pinecone_create_serverless_index",
    index_name=index_name,
    dimension=128,
    cloud="aws",
    region="us-west-2",
    metric="cosine",
)

此条目有帮助吗?