LoopR的更好替代品

作者：etqq | 来源：互联网 | 2022-12-10 13:00

如何解决《LoopR的更好替代品》经验，为你挑选了1个好方法。

我根据此条件在列c中存储值.我的数据框中有400万行,这需要2天才能完成.

for ( i in 1:NROW(df)) {
  df$c[i+1] <- df$a[i] + df$b[i] - df$a[i+1]
  print(i)
}

有没有替代这个for循环可以完成我正在做得更快的事情.提前致谢.

1> Maurits Ever..：

首先,最好提供一些样本数据并匹配预期输出,以说明您希望实现的目标.这将使SO社区更容易提供帮助.

除此之外,你可以使用 dplyr::lag

library(dplyr)
df <- mutate(df, c = lag(a) + lag(b) - a)

以下是基于我创建的示例数据的示例

# Sample data
df <- data.frame(
    a = 1:10,
    b = 11:20)

df <- mutate(df, c = lag(a) + lag(b) - a)
df
#    a  b  c
#1   1 11 NA
#2   2 12 10
#3   3 13 11
#4   4 14 12
#5   5 15 13
#6   6 16 14
#7   7 17 15
#8   8 18 16
#9   9 19 17
#10 10 20 18

你确实可以确认一下c[i+1] = a[i] + b[i] - a[i+1].

基准分析

让我们在性能/运行时方面比较以下三种方法

使用dplyr::lag和dplyr::mutate

使用基数R(感谢@nicola),

运用 data.table::shift

我们使用由样本数据10^6条目a和b.

set.seed(2017)
df <- data.frame(
    a = sample(100, 10^6, replace = T),
    b = sample(100, 10^6, replace = T))

library(microbenchark)
res <- microbenchmark(
    method_lag = {
        df <- mutate(df, c = lag(a) + lag(b) - a)
    },
    method_base = {
        df$c <- NA
        df$c[-1] <- df$a[-nrow(df)] + df$b[-nrow(df)] - df$a[-1]
    },
    method_shift = {
        df$c <- shift(df$a) + shift(df$b) - df$a
    })
#Unit: milliseconds
#         expr      min       lq     mean   median        uq       max neval cld
#   method_lag 19.88495 21.81414 29.30085 23.83718  26.61746 107.04355   100  b
#  method_base 51.00888 56.29822 90.05291 60.65321 128.79227 208.80537   100   c
# method_shift 10.86351 12.51993 18.34094 14.24705  16.88488  92.83246   100 a

autoplot(res)

在此输入图像描述

推荐阅读

int
SpringBoot uri统一权限管理的实现方法及步骤详解

本文详细介绍了SpringBoot中实现uri统一权限管理的方法，包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性，实现对系统任意接口的权限拦截验证。 ... [详细]

蜡笔小新 2023-12-14 16:11:30
int
Java String与StringBuffer的区别及其应用场景

本文主要介绍了Java中String和StringBuffer的区别，String是不可变的，而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象，内存使用上要优于String类。因此，在需要频繁对字符串进行修改的情况下，使用StringBuffer更加适合。同时，文章还介绍了String和StringBuffer的应用场景。 ... [详细]

蜡笔小新 2023-12-13 19:21:06
int
自动轮播，反转播放的ViewPagerAdapter的使用方法和效果展示

本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter，并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]

蜡笔小新 2023-12-13 14:41:31
int
iOS实现UITextField+Limit的字符限制方法

本文介绍了在iOS开发中使用UITextField实现字符限制的方法，包括利用代理方法和使用BNTextField-Limit库的实现策略。通过这些方法，开发者可以方便地限制UITextField的字符个数和输入规则。 ... [详细]

蜡笔小新 2023-12-12 09:50:30
int
Oracle存储过程写法小例子及已命名的异常

本文介绍了Oracle存储过程的基本语法和写法示例，同时还介绍了已命名的系统异常的产生原因。 ... [详细]

蜡笔小新 2023-12-11 15:10:15
int
C++标准库string类型的操作总结

总结一下C中string的操作，来自〈CPrimer〉第四版。1.string对象的定义和初始化:strings1;空串strings2(s1);将s2初始 ... [详细]

蜡笔小新 2023-12-09 09:05:48
int
C++Builder实现获取USB优盘序列号的方法

本文介绍了使用C++Builder实现获取USB优盘序列号的方法，包括相关的代码和说明。通过该方法，可以获取指定盘符的USB优盘序列号，并将其存放在缓冲中。该方法可以在Windows系统中有效地获取USB优盘序列号，并且适用于C++Builder开发环境。 ... [详细]

蜡笔小新 2023-12-09 08:17:53
int
判断编码是否可立即解码的程序及电话号码一致性判断程序

本文介绍了两个编程题目，一个是判断编码是否可立即解码的程序，另一个是判断电话号码一致性的程序。对于第一个题目，给出一组二进制编码，判断是否存在一个编码是另一个编码的前缀，如果不存在则称为可立即解码的编码。对于第二个题目，给出一些电话号码，判断是否存在一个号码是另一个号码的前缀，如果不存在则说明这些号码是一致的。两个题目的解法类似，都使用了树的数据结构来实现。 ... [详细]

蜡笔小新 2023-12-09 02:47:15
search
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
int
《数据结构》学习笔记3——串匹配算法性能评估

本文主要讨论串匹配算法的性能评估，包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库，可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n)，通过随机取出长度为m的子串作为模式P，在文本T中进行匹配，统计平均复杂度。对于成功和失败的匹配分别进行测试，分析其平均复杂度。详情请参考相关学习资源。 ... [详细]

蜡笔小新 2023-12-13 16:16:05
int
开发笔记：select from具体执行相关知识介绍及案例分析

本文由编程笔记小编整理，主要介绍了select from具体执行相关的知识，包括数据插入、查询最小rowID、查询每个重复名字的最小rowID、删除重复数据等操作，并提供了案例分析。希望对读者有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-13 15:54:05
int
动态规划算法的基本步骤及最长递增子序列问题详解

本文详细介绍了动态规划算法的基本步骤，包括划分阶段、选择状态、决策和状态转移方程，并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中，在以后尽可能多地利用这些子问题的解，从而提高算法的效率。 ... [详细]

蜡笔小新 2023-12-13 15:38:19
int
游标的使用笔记

本文介绍了游标的使用方法，并以一个水果供应商数据库为例进行了说明。首先创建了一个名为fruits的表，包含了水果的id、供应商id、名称和价格等字段。然后使用游标查询了水果的名称和价格，并将结果输出。最后对游标进行了关闭操作。通过本文可以了解到游标在数据库操作中的应用。 ... [详细]

蜡笔小新 2023-12-13 15:24:30
int
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
int
ShiftLeft：将静态防护与运行时防护结合的持续性安全防护解决方案

ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题，而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合，ShiftLeft帮助企业实现DevSecOps的安全部分，提供高效、准确的安全能力。 ... [详细]

蜡笔小新 2023-12-10 10:45:15

etqq

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章