365bet中文官方网站

BlazingDB安装部署与使用

📅 2025-07-28 14:31:11 👤 admin 👁️ 4944 🏷️ 368

一、什么是BlazingSQL

BlazingSQL是一个基于RAPIDS生态系统构建的GPU加速SQL引擎。RAPIDS基于Apache Arrow柱状内存格式,cuDF是一个GPU DataFrame库,用于加载,连接,聚合,过滤和操作数据。

二、BlazingSQL必要环境

系统:Ubuntu 16.04 LTS GPU 支持:Pascal or Better、Compute Capability >=6.1 CUDA 支持:9.2 或者大于9.2的 Docker 支持:Docker CE v18+ Apt for Ubuntu16.04 doesn’t include v18+ by default Make sure you go through the Docker repository set up steps before installing Docker CE NVIDIA Docker 支持:nvidia-docker v2+

三、安装命令

拉取镜像:

sudo docker pull blazingdb/blazingsql

启动服务:

sudo docker run --runtime=nvidia --rm -p 8888:80 -p 8787:8787 -p 8786:8786 blazingdb/blazingsql:latest

使用Jupyter进行打开:

http://localhost:8888 或者 http://{IPADDR}:8888 (ex: http://12.34.567.89:8888)

代码实例:

from blazingsql import BlazingContext

import cudf

import dask_cudf

import dask

from dask.distributed import Client

client = Client('127.0.0.1:8786')

bc = BlazingContext(dask_client=client)

bc.s3('dir_name', bucket_name='bucket_name', access_key_id='access_key', secret_key='secret_key')

table_list = ['s3://dir_name/parquet_dir/1_0_0.parquet', 's3://dir_name/parquet_dir/1_1_0.parquet', 's3://dir_name/parquet_dir/1_2_0.parquet']

bc.create_table('table_name', table_list)

result = bc.sql('SELECT COUNT(*) FROM table_name').get()

print(result.head())

查数据:

from blazingsql import BlazingContext

import cudf

bc = BlazingContext()

bc.create_table('table_name', '...file_path/table.csv')

result = bc.sql('select * from table_name').get()

gdf_result = result.columns

相关推荐

一切都得靠自己的句子(必备40句)

1、这个世界上没有什么事是靠别人就能解决的,一切都得靠自己。 2、不要期待别人帮助你,因为在绝大多数情况下都必须靠自己跨越障碍。 3

深度案例拆解:Lululemon如何在头部运动品中杀出一条血路

来源:雪球App,作者: 有力的股指天狼,(https://xueqiu.com/7275769621/283152238) 前言:近两年,Lululemon 可以说是在头部运动品赛道上杀出的一匹黑

手机点歌教程:一步步教你如何在KTV、直播平台和社交媒体上点歌

手机怎么点歌?一步步教你操作 如今,随着科技的飞速发展,手机已经成为我们日常生活中不可或缺的一部分。手机不仅可以用来打电话、上网