avatar
文章
50
标签
23
分类
7

像一个灯塔一样,燃烧自我,照射光明

像一个灯塔一样,燃烧自我,照射光明

将MIMIC数据载入PostgreSQL及遇到的问题
发表于2023-05-16|SQL
1.记录将MIMIC-IV1.0导入到PostgreSQL时用的代码1.1打开SQL Shell连续回车四下,输入密码 1.2创建数据库以保存数据DROP DATABASE IF EXISTS mimiciv; CREATE DATABASE mimiciv OWNER postgres; 如果是首次安装MIMIC,则“ DROP DATABASE”命令将警告不存在数据库,这是正常的。而第二句,这将创建mimic用户拥有的数据库postgres。当然,如果您愿意,也可以更改这些值,但是请注意,此处所做的任何更改都需要在后续步骤中进行进一步的更改。所以不推荐更改。 1.3连接到mimic数据库\c mimiciv; 1.4在数据库中创建表1、默认情况下postgres使用public架构。虽然这是个人喜好,但建议创建一个独立的架构来托管数据。为此,创建mimiciv模式: CREATE SCHEMA mimiciv; 2、通知postgres默认情况下应使用该mimiciv架构。**每次启动psql时都需要执行此操作**。 set search_path to mimiciv; ...
MyBatis逆向工程
发表于2023-05-16|Java
1.逆向工程简介MyBatis Generator: 简称MBG,是一个专门为MyBatis框架使用者定制的代码生成器,可以快速的根据表生成对应的映射文件,接口,以及bean类。支持基本的增删改查,以及QBC风格的条件查询。但是表连接、存储过程等这些复杂sql的定义需要我们手工编写官方文档地址:http://www.mybatis.org/generator/官方工程地址:https://github.com/mybatis/generator/releases 2.逆向工程的配置2.1导入逆向工程的jar包maven仓库地址:https://mvnrepository.com/ 在maven仓库网站中搜mybatis-generator-core 这里以1.3.6为例,复制到pom.xml导入包 <!-- https://mvnrepository.com/artifact/org.mybatis.generator/mybatis-generator-core --><dependency> <groupId>org.mybatis.g ...
SQL开发
发表于2023-05-10|SQL
SQL开发 第1章:SQL概述SQL:Structured Query Language结构化查询语言,它是使用关系模型的数据库应用语言,由IBM上世纪70年代开发出来。后由美国国家标准局(ANSI)开始着手制定SQL标准,先后有SQL-86,SQL-89,SQL-92,SQL-99等标准。 1. SQL的语言规范 mysql对于SQL语句不区分大小写,SQL语句关键字尽量大写 SQL 可以写在一行或者多行。为了提高可读性,各子句分行写,必要时使用缩进 关键字不能被缩写也不能分行 值,除了数值型,字符串型和日期时间类型使用单引号(’ ‘) 别名,尽量使用双引号(” “),而且不建议省略as 所有标点符号使用英文状态下的半角输入方式 必须保证所有(),单引号,双引号是成对结束的 可以使用(1)#单行注释 (2)–空格单行注释 (3)/* 多行注释 */ 2. 命名规则 数据库、表名不得超过30个字符,变量名限制为29个 必须只能包含 A–Z, a–z, 0–9, _共63个字符 不能在对象名的字符间留空格 必须不能和用户定义的其他对象重名 必须保证你的字段没有和 ...
附录B 更多关于IPython的内容(完)
发表于2023-04-22|《利用Python进行数据分析》
第2章中,我们学习了IPython shell和Jupyter notebook的基础。本章中,我们会探索IPython更深层次的功能,可以从控制台或在jupyter使用。 B.1 使用命令历史Ipython维护了一个位于磁盘的小型数据库,用于保存执行的每条指令。它的用途有: 只用最少的输入,就能搜索、补全和执行先前运行过的指令; 在不同session间保存命令历史; 将日志输入/输出历史到一个文件 这些功能在shell中,要比notebook更为有用,因为notebook从设计上是将输入和输出的代码放到每个代码格子中。 搜索和重复使用命令历史Ipython可以让你搜索和执行之前的代码或其他命令。这个功能非常有用,因为你可能需要重复执行同样的命令,例如%run命令,或其它代码。假设你必须要执行: In[7]: %run first/second/third/data_script.py 运行成功,然后检查结果,发现计算有错。解决完问题,然后修改了data_script.py,你就可以输入一些%run命令,然后按Ctrl+P或上箭头。这样就可以搜索历史命令,匹配输入字符的 ...
附录A NumPy高级应用
发表于2023-04-22|《利用Python进行数据分析》
在这篇附录中,我会深入NumPy库的数组计算。这会包括ndarray更内部的细节,和更高级的数组操作和算法。 本章包括了一些杂乱的章节,不需要仔细研究。 A.1 ndarray对象的内部机理NumPy的ndarray提供了一种将同质数据块(可以是连续或跨越)解释为多维数组对象的方式。正如你之前所看到的那样,数据类型(dtype)决定了数据的解释方式,比如浮点数、整数、布尔值等。 ndarray如此强大的部分原因是所有数组对象都是数据块的一个跨度视图(strided view)。你可能想知道数组视图arr[::2,::-1]不复制任何数据的原因是什么。简单地说,ndarray不只是一块内存和一个dtype,它还有跨度信息,这使得数组能以各种步幅(step size)在内存中移动。更准确地讲,ndarray内部由以下内容组成: 一个指向数据(内存或内存映射文件中的一块数据)的指针。 数据类型或dtype,描述在数组中的固定大小值的格子。 一个表示数组形状(shape)的元组。 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要“跨过”的字节数。 图A-1简单 ...
第14章 数据分析案例
发表于2023-04-22|《利用Python进行数据分析》
本书正文的最后一章,我们来看一些真实世界的数据集。对于每个数据集,我们会用之前介绍的方法,从原始数据中提取有意义的内容。展示的方法适用于其它数据集,也包括你的。本章包含了一些各种各样的案例数据集,可以用来练习。 案例数据集可以在Github仓库找到,见第一章。 #14.1 来自Bitly的USA.gov数据 2011年,URL缩短服务Bitly跟美国政府网站USA.gov合作,提供了一份从生成.gov或.mil短链接的用户那里收集来的匿名数据。在2011年,除实时数据之外,还可以下载文本文件形式的每小时快照。写作此书时(2017年),这项服务已经关闭,但我们保存一份数据用于本书的案例。 以每小时快照为例,文件中各行的格式为JSON(即JavaScript Object Notation,这是一种常用的Web数据格式)。例如,如果我们只读取某个文件中的第一行,那么所看到的结果应该是下面这样: In [5]: path = 'datasets/bitly_usagov/example.txt'In [6]: open(path).readline()Out[6]: &# ...
第13章 Python建模库介绍
发表于2023-04-22|《利用Python进行数据分析》
本书中,我已经介绍了Python数据分析的编程基础。因为数据分析师和科学家总是在数据规整和准备上花费大量时间,这本书的重点在于掌握这些功能。 开发模型选用什么库取决于应用本身。许多统计问题可以用简单方法解决,比如普通的最小二乘回归,其它问题可能需要复杂的机器学习方法。幸运的是,Python已经成为了运用这些分析方法的语言之一,因此读完此书,你可以探索许多工具。 本章中,我会回顾一些pandas的特点,在你胶着于pandas数据规整和模型拟合和评分时,它们可能派上用场。然后我会简短介绍两个流行的建模工具,statsmodels和scikit-learn。这二者每个都值得再写一本书,我就不做全面的介绍,而是建议你学习两个项目的线上文档和其它基于Python的数据科学、统计和机器学习的书籍。 13.1 pandas与模型代码的接口模型开发的通常工作流是使用pandas进行数据加载和清洗,然后切换到建模库进行建模。开发模型的重要一环是机器学习中的“特征工程”。它可以描述从原始数据集中提取信息的任何数据转换或分析,这些数据集可能在建模中有用。本书中学习的数据聚合和GroupBy工具常用于特征工程 ...
第12章 pandas高级应用
发表于2023-04-22|《利用Python进行数据分析》
前面的章节关注于不同类型的数据规整流程和NumPy、pandas与其它库的特点。随着时间的发展,pandas发展出了更多适合高级用户的功能。本章就要深入学习pandas的高级功能。 12.1 分类数据这一节介绍的是pandas的分类类型。我会向你展示通过使用它,提高性能和内存的使用率。我还会介绍一些在统计和机器学习中使用分类数据的工具。 背景和目的表中的一列通常会有重复的包含不同值的小集合的情况。我们已经学过了unique和value_counts,它们可以从数组提取出不同的值,并分别计算频率: In [10]: import numpy as np; import pandas as pdIn [11]: values = pd.Series(['apple', 'orange', 'apple', ....: 'apple'] * 2)In [12]: valuesOut[12]: 0 apple1 orange2 apple3 ...
第11章 时间序列
发表于2023-04-22|《利用Python进行数据分析》
时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包括金融学、经济学、生态学、神经科学、物理学等。在多个时间点观察或测量到的任何事物都可以形成一段时间序列。很多时间序列是固定频率的,也就是说,数据点是根据某种规律定期出现的(比如每15秒、每5分钟、每月出现一次)。时间序列也可以是不定期的,没有固定的时间单位或单位之间的偏移量。时间序列数据的意义取决于具体的应用场景,主要有以下几种: 时间戳(timestamp),特定的时刻。 固定时期(period),如2007年1月或2010年全年。 时间间隔(interval),由起始和结束时间戳表示。时期(period)可以被看做间隔(interval)的特例。 实验或过程时间,每个时间点都是相对于特定起始时间的一个度量。例如,从放入烤箱时起,每秒钟饼干的直径。 本章主要讲解前3种时间序列。许多技术都可用于处理实验型时间序列,其索引可能是一个整数或浮点数(表示从实验开始算起已经过去的时间)。最简单也最常见的时间序列都是用时间戳进行索引的。 提示:pandas也支持基于timedeltas的指数,它可以有效代表 ...
第10章 数据聚合与分组运算
发表于2023-04-22|《利用Python进行数据分析》
对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之后,通常就是计算分组统计或生成透视表。pandas提供了一个灵活高效的gruopby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 关系型数据库和SQL(Structured Query Language,结构化查询语言)能够如此流行的原因之一就是其能够方便地对数据进行连接、过滤、转换和聚合。但是,像SQL这样的查询语言所能执行的分组运算的种类很有限。在本章中你将会看到,由于Python和pandas强大的表达能力,我们可以执行复杂得多的分组运算(利用任何可以接受pandas对象或NumPy数组的函数)。在本章中,你将会学到: 使用一个或多个键(形式可以是函数、数组或DataFrame列名)分割pandas对象。 计算分组的概述统计,比如数量、平均值或标准差,或是用户定义的函数。 应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。 计算透视表或交叉表。 执行分位数分析以及其它统计分组分析。 笔记:对时间序列数据的聚合(group ...
12345
avatar
hyh
人人为我,我为人人
文章
50
标签
23
分类
7
Follow Me
公告
This is my Blog
最新文章
网站测试过程2024-03-26
六自由度机械手臂2024-03-26
网站测试过程2024-03-26
增强现实空间感知2024-03-26
Spring常用注解2024-03-26
分类
  • IDEA2
  • Java11
  • Python1
  • SQL3
  • 《利用Python进行数据分析》16
  • 个人博客2
  • 深度学习7
标签
PostSQL LeetCode MySQL Test 学习NumPy和Pandas Redis Java前端 Dubbo 复习SQL MyBatis 代码复现 Python IDEA Vue Pytorch 管理个人博客 NumPy 深度学习 SpringBoot MySQL高级 Mybatis Linux scipy
归档
  • 三月 20246
  • 八月 20231
  • 七月 20238
  • 六月 20234
  • 五月 20234
  • 四月 202327
网站资讯
文章数目 :
50
本站总字数 :
268.6k
本站访客数 :
本站总访问量 :
最后更新时间 :
©2020 - 2024 By hyh
框架 Hexo|主题 Butterfly