【R语言】完美解决devtools安装GitHub包失败的问题(以gwasglue为例)

2023-09-21 02:52:50
  • Rstudio,R4.3.1,命令在Rstudio的命令行即console中运行。

一、问题复述

使用devtools安装一个github的包。

devtools:

devtools 是 R 语言中一个非常有用的包,它提供了一套工具和函数,用于开发、测试和维护 R 包,devtools 可以帮助 R 包的开发人员更轻松地进行包的创建、文档编写、测试和发布等任务。 devtools 的一些主要功能和用途:

  1. 创建新的 R 包: devtools 提供了一个函数 create(),可以用于创建新的 R 包的框架,包括必要的目录结构和文件。

  2. 加载和安装包: devtools 提供了 load_all() 函数,它可以加载包的最新版本到 R 会话中,使开发者可以更快速地测试和调试包的功能。此外,install() 函数可以用于安装包。

  3. 文档编写: devtools 提供了 document() 函数,用于自动生成包的文档,包括 Roxygen2 风格的注释,这些注释可以用于生成包的帮助文档。

  4. 测试: devtools 通过 test() 函数支持包的测试,开发者可以编写测试用例来确保包的功能正常工作。这有助于减少错误和提高包的质量。

  5. 检查和验证包: devtools 提供了 check() 函数,它可以运行 R CMD check 命令,用于检查包是否符合 CRAN(Comprehensive R Archive Network)的要求,以便发布到 CRAN 上。

  6. 发布和分享包: 一旦开发者完成了包的开发和测试,devtools 提供了 release() 函数,用于将包发布到 CRAN 或其他 R 包仓库。

  7. 包的依赖管理: devtools 还支持包的依赖关系管理,可以帮助开发者管理包的依赖关系,确保包在不同环境中的兼容性。

安装devtools,和安装其他包一样的:

install.packages("devtools")

使用devtools安装GitHub的包:

devtools::install_github("mrcieu/gwasglue")

报错:

在这里插入图片描述

二、分析

首先看报错信息,这是解决编程问题最基本的步骤。

我先看的时download xxxx failed。这个问题通常时网络问题,但是我的电脑不可能出现这种问题😉

但是,读者需要先解决网络问题,首先确保你的电脑能流畅访问GitHub,最简单的方法就是修改hosts文件(本地dns缓存,就是把github的域名解析陈ip地址,github有很多ip地址(CDN),有的ip地址是网络可以直接访问的)。如果你的网络有问题,又不太会修改hosts文件,直接下载我的小程序就可以修改了:https://download.csdn.net/download/weixin_43764974/87405879

或者你直接开代理(如果你会搭建或者有其他的话)。


排除了网络问题,报错信息就剩一行了:

Error in utils::download.file(url, path, method = method, quiet = quiet,

我这方面有点经验,一眼就觉得 utils的method 可能存在问题。

utils:

utils是R语言的一个基础包,它提供了一些有用的函数,用于编程和开发R包。utils包的功能包括:

  • 数据导入和导出,例如read.table、write.table、read.csv、write.csv等。
  • 数据探索和处理,例如str、summary、head、tail、View等。
  • 帮助文档的查看和管理,例如help、help.search、browseVignettes等。
  • R包的安装和更新,例如install.packages、update.packages、available.packages等。
  • R会话的管理和配置,例如q、save、load、options、sessionInfo等。
  • 其他一些实用的工具,例如combn、choose、menu、timestamp、txtProgressBar等。

OK,问题已锁定👌

三、解决

既然是utilsmethod有问题,就先看看method的值:

Rstudio的命令行输入:

getOption("download.file.method")

输出的method值可能是:

  • internal”:使用R内置的函数来下载文件,这种方法适用于所有平台,但不支持https://和ftps://协议,也不支持重定向和缓存控制。
  • wininet”:使用Windows操作系统上的WinINet函数来下载文件,这种方法只适用于Windows平台,支持https://协议和一些重定向,但不支持ftps://协议和缓存控制。
  • libcurl”:使用libcurl库来下载文件,这种方法需要R编译时支持该库,支持https://和ftps://协议和重定向,也支持同时下载多个文件。
  • wget”:使用Wget工具来下载文件,这种方法需要在系统上安装Wget程序,并在可执行文件的搜索路径中,支持https://和ftps://协议和重定向,但会阻塞R进程直到完成。
  • curl”:使用Curl工具来下载文件,这种方法需要在系统上安装Curl程序,并在可执行文件的搜索路径中,支持https://和ftps://协议和重定向,但会阻塞R进程直到完成。
  • auto”(默认值):R将根据操作系统和配置自动选择下载方法,在Unix类似平台上使用"libcurl"方法,在Windows平台上使用"wininet"方法。

我的默认值是libcurl,通过测试,修改为wininet即可成功下载。(至少curl和wget你不应该感到陌生)

可以在命令行输入:

options(download.file.method = "wininet") 

不过这是暂时的,下一次打开Rstudio就失效了,需要修改R的配置文件。


R配置文件:

R的配置文件是一些用来设置R环境和选项的文本文件,它们可以在不同的位置和级别存在,例如R安装目录、用户目录或当前工作目录。R启动时会按照一定的顺序读取这些配置文件,并执行其中的代码。

R的配置文件主要有以下几种:

  • Rprofile.site:这是一个站点级别的配置文件,它位于R安装目录的etc子目录中,例如C:\Program Files\r\r-n.n.n\etc\Rprofile.site。这个文件会在每次启动R时最先被读取,它可以用来设置全局的选项或变量。
  • .Renviron:这是一个用来设置环境变量的配置文件,它可以位于R安装目录、用户目录或当前工作目录中,例如C:\Program Files\r\r-n.n.n\etc\.Renviron、C:\Users\username\.Renviron或D:\project\.Renviron。这个文件会在每次启动R时紧接着Rprofile.site被读取,它可以用来告诉R在哪里寻找外部程序或资源。
  • .Rprofile:这是一个用来设置用户或项目级别的选项或变量的配置文件,它可以位于用户目录或当前工作目录中,例如C:\Users\username\.Rprofile或D:\project\.Rprofile。这个文件会在每次启动R时最后被读取,它可以用来自定义用户信息或加载特定的包。

修改Rprofile.site这个文件,在最后一行添加:

options(download.file.method = "wininet")

在这里插入图片描述

保存,重新打开Rstudio,查看method:

> getOption("download.file.method")
[1] "wininet"

修改完成。


现在就可以安装GitHub的包包了。

四、安装示例:gwasglue

gwasglue是一个R程序包,它可以将GWAS(全基因组关联分析)的数据源连接到R中的各种分析工具,例如用于共定位、精细定位、孟德尔随机化、可视化等的工具。gwasglue的目的是为了方便用户在不同的软件包之间转换和分析GWAS数据,而不需要进行复杂的格式转换或数据处理。

gwasglue目前支持以下数据源和分析工具:

  • 数据源:ieugwasr(用于从IEU GWAS数据库中检索GWAS数据)和gwasvcf(用于从VCF文件中读取GWAS数据)。
  • 共定位:coloc(用于检测两个或多个表型之间的共同遗传变异)和HEIDI(用于检测异质性)。
  • 精细定位:finemapr(用于调用FINEMAP软件进行精细定位)、PAINTOR(用于整合功能注释信息进行精细定位)和CAVIAR(用于计算后验概率进行精细定位)。
  • 孟德尔随机化:TwoSampleMR(用于进行双样本孟德尔随机化分析)、MendelianRandomization(用于进行单样本孟德尔随机化分析)、RadialMR(用于进行径向孟德尔随机化分析)和MRPRESSO(用于检测异常值和方向性异质性)。
  • 可视化:gassocplot(用于绘制基因组关联图)。

GitHub给你的安装命令是:

devtools::install_github("mrcieu/gwasglue")


现在,安装还会有一些小问题:

第一个是devtools与GitHub之间的连接问题,直接使用devtools,一小时只允许下载文件60次。安装gwasglue需要几百个依赖包、文件。

报错:
Error: Failed to install ‘unknown package’ from GitHub:
HTTP error 403.
API rate limit exceeded for 113.250.229.180. (But here’s the good news: Authenticated requests get a higher rate limit. Check out the documentation for more details.)
Rate limit remaining: 0/60
Rate limit reset at: 2023-09-20 17:12:21 UTC
To increase your GitHub API rate limit
- Use usethis::create_github_token() to create a Personal Access Token.
- Use usethis::edit_r_environ() and add the token as GITHUB_PAT.

可以看到次数已经用完了,解决方法也告诉你了,贴心😘

运行:

usethis::create_github_token()

会转到github,引导你创建个人访问令牌,跟着弄就行了:
在这里插入图片描述

回到命令行:

usethis::edit_r_environ()

会在编辑区域打开配置文件,添加:

GITHUB_PAT = ghp_08szR5HyYyfsueh48(你的令牌)

在这里插入图片描述


现在每个小时应该是有5000次下载次数,随便霍霍。

不过安装gwasglue还有问题,

报错:

ERROR: dependency ‘gwasvcf’ is not available for package ‘gwasglue’
removing ‘D:/R/R-4.3.1/library/gwasglue’

要先安装gwasvcf,当你直接安装它,又会提示你需要安装xxxxxxxxxxxxx,套娃~

安装gwasvcf包时,缺少一些生物信息学相关的依赖包。这些依赖包是一些用于处理基因组数据的R包,它们属于Bioconductor项目。Bioconductor是一个用于分析高通量基因组数据的开源软件项目,它提供了一些专门的R包和工具。

步骤:

  • install.packages("BiocManager") # 安装BiocManager包

  • BiocManager::install(c("BiocGenerics", "Biostrings", "GenomeInfoDb", "GenomicRanges", "IRanges", "Rsamtools", "S4Vectors", "SummarizedExperiment", "VariantAnnotation")) # 安装依赖包

  • 在安装gwasvcf包时,使用build_vignettes参数来跳过构建vignettes的步骤。vignettes是一些用于展示R包功能和用法的文档,它们可能需要一些额外的依赖包。如果不需要查看vignettes,使用以下命令来安装gwasvcf包:

  • devtools::install_github("mrcieu/gwasvcf", build_vignettes = FALSE) # 安装gwasvcf包,不构建vignettes

在这里插入图片描述

现在再安装就OK了:

devtools::install_github("mrcieu/gwasglue")

在这里插入图片描述

注意,安装过程可能会有这个问题:

9: In download.file(url, destfile, method, mode = "wb", ...) :
  the 'wininet' method is deprecated for http:// and https:// URLs

mode=“wb”,而url是http,websocket是不支持http链接的(又是考验知识积累的时候了哟),在设置里面允许不安全即可:Tools--Global options...

在这里插入图片描述


总结:多看报错信息,当然,需要结合一定的综合知识积累。



~

更多推荐

CSP-J 2023 入门级 第一轮 阅读程序(1)

【题目】CSP-J2023入门级第一轮阅读程序(1)#include<iostream>#include<cmath>usingnamespacestd;doublef(doublea,doubleb,doublec){doubles=(a+b+c)/2;returnsqrt(s*(s-a)*(s-b)*(s-c));

七天学会C语言-第六天(指针)

1.指针变量与普通变量指针变量与普通变量是C语言中的两种不同类型的变量,它们有一些重要的区别和联系。普通变量是一种存储数据的容器,可以直接存储和访问数据的值。:intnum=10;//定义一个整数型普通变量num,赋值为10在例子中,变量num是一个普通整数变量,它直接存储了值10。指针变量是一种特殊类型的变量,它存储

面试经典刷题)挑战一周刷完150道-Python版本-第2天(22个题)

一、轮转数组给定一个整数数组nums,将数组中的元素向右轮转k个位置,其中k是非负数。这用于旋转一个整数列表nums中的元素。k%=len(nums):这一行的目的是确保k的值在合理的范围内,因为如果k大于列表的长度len(nums),旋转是循环的,所以我们取余数来确保k在合适的范围内,以避免不必要的重复旋转。比如,如

【Java 基础篇】Java网络编程实时数据流处理

在现代计算机应用程序中,处理实时数据流是一项关键任务。这种数据流可以是来自传感器、网络、文件或其他源头的数据,需要即时处理并做出相应的决策。Java提供了强大的网络编程工具和库,可以用于处理实时数据流。本文将详细介绍如何使用Java进行实时数据流处理。什么是实时数据流?实时数据流是一连串持续不断到达的数据,需要及时处理

【UE 粒子练习】08——LOD概述

目录概念应用举例一、检查当前粒子系统中是否设置了LOD二、添加LOD三、LOD设置(单个粒子发射器)四、LOD设置(多个粒子发射器)概念在UnrealEngine中,LOD(LevelofDetail,细节层次)是一种优化技术,用于在不同距离或屏幕空间尺寸下使用不同的模型或网格,以提高性能并减少资源消耗。LOD技术的主

低功耗蓝牙物联网:未来连接的无限可能

物联网是连接各种设备和传感器的网络,其目的是实现信息的交换和共享,提高效率并优化生活。在这个领域,低功耗蓝牙(BLE)正在发挥着越来越重要的作用。低功耗蓝牙是一种无线通信技术,它的主要特点是低功耗和长寿命。在保证纽扣电池长时间使用的同时,BLE的广播模式功耗可以做到1mA以下,进入低功耗模式后甚至可以达到200ua以下

第一个 Go 程序“hello,world“ 与 main 函数

第一个Go程序"hello,world"与main函数文章目录第一个Go程序"hello,world"与main函数一.创建“hello,world”示例程序二.“hello,world”程序结构拆解三、main函数四、Go语言中程序是怎么编译的?一.创建“hello,world”示例程序创建一个叫做main的go文件

Haproxy负载均衡集群 超详细 (附部署实例)

Haproxy一、Web集群调度器1.1常用的Web集群调度器1.2常用集群调度器的优缺点(LVS,Nginx,Haproxy)1.2.1Nginx1.2.2LVS1.2.3Haproxy1.3LVS、Nginx、Haproxy的区别二、Haproxy2.1简介2.2Haproxy的主要特性2.3Haproxy应用分析

总结 HTTP 协议的基本格式和 fiddler 的用法

HTTP基本格式HTTP协议也是日常开发中非常常用的的一种协议,在众多协议栈里HTTP可能是实际开发中用的最多的。注意这里说的HTTP是指HTTP1以及HTTP2,他们都是基于TCP协议的,注意:如今最新版的HTTP3是基于UDP的。但如今在互联网中使用的最多的仍然是HTTP1.1的版本。在整个协议栈中,上层和下层之间

【VUE异常】el-popconfirm失效,@confirm事件不生效,点击没有任何反应,刷新页面才能点击

el-popconfirm失效,@confirm事件不生效,点击没有任何反应,刷新页面才能点击一、背景描述二、原因分析三、解决方案3.1方案一:使用@onConfirm3.2方案二:@confirm与@onConfirm同时使用3.3方案三:el-popconfirm标签外包裹一层标签一、背景描述项目中遇到一个奇怪的问

【实战项目之个人博客】

目录项目背景项目技术栈项目介绍项目亮点项目启动1.创建SSM(省略)2.配置项目信息3.将前端页面加入到项目中4.初始化数据库5.创建标准分层的目录6.创建和编写项目中的公共代码以及常用配置7.创建和编写业务的Entity、Mapper、Service、Controller等基础代码8.按照页面,从前端或者后端开始实现

热文推荐