Пожалуй, самый простой вводный практический туториал по ClickHouse!
Среда: Springboot 2.4
Интегрированная технология: durid + mybatis + clickhouse
Сцены
В последнее время я работаю над проектом анализа данных, и есть такое дело: пометить совпадающие данные и поместить их в новый индекс.
Объем данных: Совокупные данные в миллиардах
сцены, которые будут использоваться: За один раз может быть запрошен большой объем данных, но не будут заданы сложные условия, и эти данные не будут повторно изменены
Используется исходная база данных: Эластичный поиск
вопрос: Выше также было сказано, что после того, как я отметил это здесь, эти данные вряд ли будут изменены. ES — полнотекстовый поисковик, который больше подходит для крупномасштабного текстового поиска. Это не совсем соответствует моему сценарию использования выше.
Технические соображения по выбору: Вместо этого используйте ClickHouse, разработанный Fighting Nation. Он подходит для OLAP, то есть для сценариев анализа данных. После того, как данные записаны, они непрерывно извлекаются и анализируются в различных измерениях, чтобы обнаружить их коммерческую ценность. ClickHouse подходит для ситуаций, когда операций чтения намного больше, чем операций записи.
Кроме того, по сравнению с ES ClickHouse занимает меньше места на жестком диске, что также способствует снижению затрат на эксплуатацию и обслуживание.
Ниже приведены некоторые из моих практик при попытке доступа к ClickHouse и решение проблемы преобразования типа массива ClickHouse.
Для получения более подробных сведений о ClickHouse:zhuanlan.zhihu.com/p/98135840
Код примера был загружен в Git, в настоящее время обновляется раздел 28:GitHub.com/lawrence/tickets…
Mybatis + ClickHouse
Раньше Mybatis использовался для работы с MySQL, на самом деле Mybatis также может работать с ClickHouse, а здесь Druid используется для управления соединениями.
конфигурация maven
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>druid</artifactId>
<version>1.2.5</version>
</dependency>
<dependency>
<groupId>ru.yandex.clickhouse</groupId>
<artifactId>clickhouse-jdbc</artifactId>
<version>0.2.6</version>
</dependency>
<dependency>
<groupId>org.mybatis.spring.boot</groupId>
<artifactId>mybatis-spring-boot-starter</artifactId>
<version>2.1.3</version>
</dependency>
Конфигурационный файл:
spring:
datasource:
type: com.alibaba.druid.pool.DruidDataSource
# 注意这里是自定义的配置,通过 JdbcParamConfig 来加载配置到 Spring 中
# 然后由 DruidConfig 来配置数据源
click:
driverClassName: ru.yandex.clickhouse.ClickHouseDriver
url: jdbc:clickhouse://127.0.0.1:8123/test # ip:port/database
userName: default
password: default # 按照自己连接的 clickhouse 数据库来
initialSize: 10
maxActive: 100
minIdle: 10
maxWait: 6000
validationQuery: SELECT 1
Класс для загрузки элементов конфигурации:
@Component
@ConfigurationProperties(prefix = "spring.datasource.click")
public class JdbcParamConfig {
private String userName;
private String password;
private String driverClassName ;
private String url ;
private Integer initialSize ;
private Integer maxActive ;
private Integer minIdle ;
private Integer maxWait ;
private String validationQuery;
// ignore getters and setters
}
Настроить друида:
@Configuration
@MapperScan(basePackages = {
"com.aegis.analysis.clickhousestorage.dao"
})
public class DruidConfig {
@Resource
private JdbcParamConfig jdbcParamConfig ;
@Bean(name = "clickDataSource")
public DataSource dataSource() throws ClassNotFoundException {
Class classes = Class.forName("com.alibaba.druid.pool.DruidDataSource");
DruidDataSource dataSource = (DruidDataSource) DataSourceBuilder
.create()
.driverClassName(jdbcParamConfig.getDriverClassName())
.type(classes)
.url(jdbcParamConfig.getUrl())
.username(jdbcParamConfig.getUserName())
.password(jdbcParamConfig.getPassword())
.build();
dataSource.setMaxWait(jdbcParamConfig.getMaxWait());
dataSource.setValidationQuery(jdbcParamConfig.getValidationQuery());
return dataSource;
}
@Bean
public SqlSessionFactory clickHouseSqlSessionFactoryBean() throws Exception {
SqlSessionFactoryBean factory = new SqlSessionFactoryBean();
factory.setDataSource(dataSource());
// 实体 model的 路径 比如 com.order.model
factory.setTypeAliasesPackage("com.example.clickhousedemo.model");
//添加XML目录
ResourcePatternResolver resolver = new PathMatchingResourcePatternResolver();
factory.setMapperLocations(resolver.getResources("classpath:mapper/*.xml"));
//开启驼峰命名转换
factory.getObject().getConfiguration().setMapUnderscoreToCamelCase(true);
return factory.getObject();
}
}
Определите класс UserInfo, и оператор создания таблицы будет выглядеть следующим образом:
CREATE TABLE test.user (
`id` Int16,
`name` String,
`score` Float32,
`score2` Float64,
`state` Int8,
`createTime` DateTime,
`ranks` Array(UInt8)
) ENGINE = MergeTree() ORDER BY id;
Класс сущности:
public class UserInfo {
private Integer id; // int16
private String name; // String
private Float score; // float16
private Double score2; // float32
private Boolean state; // int8
private Date createTime; // datetime
private Integer[] ranks; // Array - Array 类型需要进行类型转换
// 具体转换方法与配置参考 ClickArrayToIntHandler 类与 UserMapper.xml 中关于查询和插入时 ranks 字段的配置
// ignore getters and setters
}
Файлы DAO и Mapper пишутся так же, как и при подключении к MYSQL.
Преобразование типа массива
Здесь следует отметить, что ClickHouse имеет тип Array, который можно использовать для хранения массивов, как и в ES. Проблема в том, что преобразование типа должно быть определено само по себе. В некоторых материалах в Интернете перечислены только основные типы сценариев, я сам реализовал конвертер, вы можете обратиться к:
/**
* Java Int 数组与 ClockHouse Array Int 转换器
* @version 1.0
* @since 2019/11/14 9:59
*/
public class ClickArrayToIntHandler extends BaseTypeHandler<Integer[]> {
@Override
public void setNonNullParameter(PreparedStatement preparedStatement, int i, Integer[] integers, JdbcType jdbcType) throws SQLException {
preparedStatement.setObject(i, integers);
}
@Override
public Integer[] getNullableResult(ResultSet resultSet, String s) throws SQLException {
Object obj = resultSet.getObject(s);
return parseClickHouseArrayToInt(obj);
}
@Override
public Integer[] getNullableResult(ResultSet resultSet, int i) throws SQLException {
Object obj = resultSet.getObject(i);
return parseClickHouseArrayToInt(obj);
}
@Override
public Integer[] getNullableResult(CallableStatement callableStatement, int i) throws SQLException {
Object obj = callableStatement.getObject(i);
return parseClickHouseArrayToInt(obj);
}
private Integer[] parseClickHouseArrayToInt(Object obj) {
if (obj instanceof ClickHouseArray) {
int[] res = new int[0];
try {
res = (int[]) ((ClickHouseArray) obj).getArray();
} catch (SQLException ex) {
ex.printStackTrace();
}
if (res != null && res.length > 0) {
Integer[] resI = new Integer[res.length];
for (int i = 0; i < res.length; i++) {
resI[i] = res[i];
}
return resI;
}
}
return new Integer[0];
}
}
DAO.xml также дает пример:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd">
<mapper namespace="com.aegis.analysis.clickhousestorage.dao.UserInfoMapper">
<resultMap id="BaseResultMap" type="com.example.clickhousedemo.model.UserInfo">
<id column="id" property="id" />
<result column="name" property="name" />
<result column="name" property="name" />
<result column="score" property="score" />
<result column="score2" property="score2" />
<result column="state" property="state" />
<result column="createTime" property="createTime" />
<!-- <result column="ranks" property="ranks" jdbcType="JAVA_OBJECT" javaType="java.lang.Object" />-->
<result column="ranks" property="ranks" typeHandler="com.example.clickhousedemo.dao.ClickArrayToIntHandler" />
</resultMap>
<sql id="Base_Column_List">
*
</sql>
<insert id="saveData" parameterType="com.aegis.analysis.clickhousestorage.model.UserInfo" >
INSERT INTO user
(id,name, score, score2, state, createTime, ranks)
VALUES
(#{id},#{name}, #{score}, #{score2}, #{state}, #{createTime}, #{ranks, jdbcType=ARRAY,
typeHandler=com.example.clickhousedemo.dao.ClickArrayToIntHandler})
</insert>
<select id="selectById" resultMap="BaseResultMap">
select
<include refid="Base_Column_List" />
from user
where id = #{id}
limit 1
</select>
<select id="selectList" resultMap="BaseResultMap" >
select
<include refid="Base_Column_List" />
from user
</select>
</mapper>
Конкретный код можно просмотреть в моем репозитории Git, а также примеры интеграции SpringBoot с другими промежуточными технологиями Добро пожаловать, звезда!