操作器¶
将数据摄取到 Pinecone 索引中¶
使用 PineconeIngestOperator
与 Pinecone API 交互以摄取向量。
使用操作器¶
PineconeIngestOperator 需要将 vectors
作为输入摄取到 Pinecone 中。使用 conn_id
参数指定用于连接到您的帐户的 Pinecone 连接。向量还可以包含引用与向量相对应的原始文本的元数据,这些元数据可以被摄取到数据库中。
以下是以这种方式使用操作器的示例
PineconeIngestOperator(
task_id="pinecone_vector_ingest",
index_name=index_name,
input_vectors=[
("id1", [1.0, 2.0, 3.0], {"key": "value"}),
("id2", [1.0, 2.0, 3.0]),
],
namespace=namespace,
batch_size=1,
)
创建基于 Pod 的索引¶
使用 CreatePodIndexOperator
与 Pinecone API 交互以创建基于 Pod 的索引。
使用操作器¶
CreatePodIndexOperator
需要索引详细信息以及 Pod 配置详细信息。api_key
、environment
可以通过参数传递给操作器,也可以通过连接传递。
以下是以这种方式使用操作器的示例
# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
CreatePodIndexOperator(
task_id="pinecone_create_pod_index",
index_name=index_name,
dimension=3,
replicas=1,
shards=1,
pods=1,
pod_type="p1.x1",
)
创建无服务器索引¶
使用 CreateServerlessIndexOperator
与 Pinecone API 交互以创建基于 Pod 的索引。
使用操作器¶
CreateServerlessIndexOperator
需要索引详细信息以及无服务器配置详细信息。api_key
、environment
可以通过参数传递给操作器,也可以通过连接传递。
以下是以这种方式使用操作器的示例
# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
CreateServerlessIndexOperator(
task_id="pinecone_create_serverless_index",
index_name=index_name,
dimension=128,
cloud="aws",
region="us-west-2",
metric="cosine",
)