logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【NLP 自然语言处理】自然语言处理技术难点和挑战

一、**NLP 技术对标注数据依赖性较高,难以在标注数据稀缺的任务、语言或领域内发挥作用。**此前小米首席 NLP 科学家王斌在接受 InfoQ 采访时也曾表示,获得大规模的高质量标注数据永远是个难题。当前主流方法的效果取决于标注数据的规模和质量。为解决这一问题,可以采用基于大规模无监督数据的预训练模型,或者尝试半监督或无监督的方法,包括零样本学习(Zero-Shot Learning)或小样本学

【深度学习 玩转keras】文本数据预处理

在深度学习运用在自然处理语言前,文本预处理是必不可少的步骤,一些常用的工具如句子句子分割,one-hot 编码,分词器都已经集成在keras预处理工具中,用户无需自己重新造轮子。下面我们将分别讲解这些功能。1、分割句子获得单词序列。from keras.preprocessing.text import Tokenizer,one_hot,text_to_word_sequenceimpor...

【opencv 报错】ImportError: libGL.so.1: cannot open shared object file: No such file or directory

ImportError: libGL.so.1: cannot open shared object file: No such file or dir可以通过安装所需的附加依赖项来解决此错误。

文章图片
#opencv#人工智能#计算机视觉
【深度学习 项目实战】Keras深度学习多变量时间序列预测的LSTM模型

本篇文章将介绍基于Keras深度学习的多变量时间序列预测的LSTM模型。项目名称:空气污染预测一、主要内容:如何将原始数据集转换为可用于时间序列预测的内容。如何准备数据并使LSTM适合多变量时间序列预测问题。如何进行预测并将结果重新缩放为原始单位。二、数据下载在本教程中,我们将使用空气质量数据集。该数据集报告了美国驻中国大使馆五年来每小时的天气和污染水平。数据包括日期时间,称为PM...

文章图片
#深度学习#keras#lstm
【python 走进NLP】从零开始搭建textCNN卷积神经网络模型

1、众所周知,tensorflow 是一个开源的机器学习框架,它的出现大大降低了机器学习的门槛,即使你没有太多的数学知识,它也可以允许你用“搭积木”的方式快速实现一个神经网络,即使没有调节太多的参数,模型的表现一般还不错。目前,tensorflow 的安装已经变得非常简单,一个简单的 pip install tensorflow 即可,然后 import tensorflow as tf 就能愉快

文章图片
#深度学习
【机器学习 Alink开源】10分钟了解下阿里开源机器学习平台alink

1、什么是Alink?Alink 是阿里巴巴计算平台事业部PAI团队从 2017 年开始基于实时计算引擎 Flink 研发的新一代机器学习算法平台,提供丰富的算法组件库和便捷的操作框架,开发者可以一键搭建覆盖数据处理、特征工程、模型训练、模型预测的算法模型开发全流程。github下载地址:https://github.com/alibaba/Alink2、pyalink 安装方式确保使用...

【大数据 minio】10分钟了解大数据存储的方案minio

docker-compose部署方案,我们需要进行安装docker与docker-compose,这个在docker文档中都有,可以参考docker-compose官网。企业上我们可以利用其分布式的功能,内部搭建图片处理服务器,文件存储服务器,公司内部的文件存储服务器,这样就不用限制存储的大小,也不限制存储位置。可以兼容亚马逊的S3存储服务接口,非常适合存储大容量的非结构化数据。我们个人可以直接在

#大数据#docker#容器
【XGBoost 时间序列预测】XGBoost做时间序列预测

XGBoost是用于分类和回归问题的梯度提升集成方法的一个实现。XGBoost是为表格式数据集的分类和回归问题而设计的,也可以用于时间序列预测。通过使用滑动时间窗口表示,时间序列数据集可以适用于有监督学习。下面我们一起来学习下:1、xgboost安装:pip install xgboost也可以使用scikit-learn API中的XGBRegressor包装类2、例子讲解让我们用一个例子来具体

【自然语言处理 词库建设】怎样将搜狗的细胞词库scel格式转化成txt格式

搜狗词库:https://pinyin.sogou.com/dict/1、先下载搜狗词库到本地,文件格式为.scel后缀2、利用python3 自动转换成txtpython3版本:# -*- coding:utf-8 -*-import structimport os# 由于原代码不适用python3且有大量bug# 以及有函数没有必要使用且一些代码书写不太规范或冗余...

【数据建模 卡方检验】了解卡方检验

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。注意:卡方检验针对分类变量。(1)提出原假设:H0:总体X的分布函数为F(x)如果总体分布为离散型,则假设具体为H0:总体X的分布律为P{X=xi}

    共 174 条
  • 1
  • 2
  • 3
  • 18
  • 请选择
OSZAR »