Beam确实支持从GCS写入/读取。你只需使用
TextIO
类。
要从一个或多个文本文件中读取PCollection,请使用TextIO.Read。您可以使用TextIO.Read.from(String)实例化转换,以指定要读取的文件的路径(例如,如果在本地运行,则为本地文件名或文件名模式,或者
的
“gs:///”形式的Google云端存储文件名或文件名模式
</强>
)。
以上参考架构表明存在
云
</跨度>
存储
</跨度>
从…下沉
云
</跨度>
数据流,但Beam API似乎是当前默认的Dataflow API没有
云
</跨度>
存储
</跨度>
I / O …连接器列出。
任何人都可以帮助澄清是否存在一个存在,如果没有什么是从Dataflow带来数据的替代方案
云
</跨度>
存储
</跨度>
。
…