用于在R中构建逻辑的计算-ComputationstobuildalogicinR

作者： | 来源：互联网 | 2023-08-29 17:24

Iamtryingtocoveralogicinexcel,howeverfailingsinceiamnotaproinexcel.我试图掩盖excel中的逻辑

I am trying to cover a logic in excel, however failing since i am not a pro in excel.

我试图掩盖excel中的逻辑，但是因为我不是excel的专业人员而失败了。

Below is how my data looks like:

以下是我的数据的样子：

  C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15
1 12  3  3  4  5  6  7  7  7   7   7   7   7   7   7
2  1  4  5  5  5  5  5  5  6   7   8   8   8   8   8
3  3  4  4  4  4 45 32 57 23  23  23  23  23  23  23

As you can see, in the first row, from the last column there are multiple 7's. Similary, for the second row starting from the last column there are multiple 8's and for row3, there are multiple 23's.

如您所见，在第一行中，从最后一列有多个7。类似地，对于从最后一列开始的第二行有多个8，而对于row3，有多个23。

I want to replace the multiple columns of 7's,8's and 23's into #N/A, and keep only the first 7 in my result. I tried it with a simple logic, where IF(C15<>C14, C15,"N/A"), however this logic fails as it also converts the previous repeated values at row level too

我想将7，8和23的多个列替换为#N / A，并且只保留结果中的前7个。我用一个简单的逻辑尝试了它，其中IF（C15 <> C14，C15，“N / A”），然而这个逻辑失败了，因为它也转换了行级别的先前重复值

Below is how i am looking for the final result.

以下是我如何寻找最终结果。

  C1 C2 C3 C4 C5 C6 C7   C8   C9  C10  C11  C12  C13  C14  C15
1 12  3  3  4  5  6  7 #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
2  1  4  5  5  5  5  5    5    6    7    8 #N/A #N/A #N/A #N/A
3  3  4  4  4  4 45 32   57   23 #N/A #N/A #N/A #N/A #N/A #N/A

Can i do it in excel, or i need to find some code in R?

我可以在excel中执行此操作，还是需要在R中找到一些代码？

Any leads would be appreciated.

任何线索将不胜感激。

THanks, Jay

谢谢，谢谢

Data:

数据：

df <- structure(list(C1 = c(12, 1, 3), C2 = c(3, 4, 4), C3 = c(3, 5, 4), 
               C4 = c(4, 5, 4), C5 = c(5, 5, 4), C6 = c(6, 5, 45), 
               C7 = c(7, 5, 32), C8 = c(7, 5, 57), C9 = c(7, 6, 23), 
               C10 = c(7, 7, 23), C11 = c(7, 8, 23), C12 = c(7, 8, 23), 
               C13 = c(7, 8, 23), C14 = c(7, 8, 23), C15 = c(7, 8, 23)), 
          .Names = c("C1", "C2", "C3", "C4", "C5", 
                     "C6", "C7", "C8", "C9", "C10",
                     "C11", "C12", "C13", "C14", "C15"), 
          row.names = c(NA, -3L), class = "data.frame")

6 个解决方案

#1

Here is an R solution using rleid from data.table:

这是使用data.table中的rleid的R解决方案：

library(data.table)
df[t(apply(df, 1, function(x) shift(rleid(x) == max(rleid(x)))))] <- NA

Result:

结果：

  C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15
1 12  3  3  4  5  6  7 NA NA  NA  NA  NA  NA  NA  NA
2  1  4  5  5  5  5  5  5  6   7   8  NA  NA  NA  NA
3  3  4  4  4  4 45 32 57 23  NA  NA  NA  NA  NA  NA

Note that this works even if the repeating integer appears anywhere in each row not connected to the repeating sequence at the end.

请注意，即使重复整数出现在每行中没有连接到末尾重复序列的任何位置，这仍然有效。

Data:

数据：

df = structure(list(C1 = c(12L, 1L, 3L), C2 = c(3L, 4L, 4L), C3 = c(3L, 
5L, 4L), C4 = c(4L, 5L, 4L), C5 = c(5L, 5L, 4L), C6 = c(6L, 5L, 
45L), C7 = c(7L, 5L, 32L), C8 = c(7L, 5L, 57L), C9 = c(7L, 6L, 
23L), C10 = c(7L, 7L, 23L), C11 = c(7L, 8L, 23L), C12 = c(7L, 
8L, 23L), C13 = c(7L, 8L, 23L), C14 = c(7L, 8L, 23L), C15 = c(7L, 
8L, 23L)), .Names = c("C1", "C2", "C3", "C4", "C5", "C6", "C7", 
"C8", "C9", "C10", "C11", "C12", "C13", "C14", "C15"), class = "data.frame", row.names = c(NA, 
-3L))

#2

With base R you can do it like the following.
This is the third version of the function, thanks to @useR for pointing out the wrong results of the others in some use cases.

使用基础R，您可以像下面这样做。这是该函数的第三个版本，感谢@useR在某些用例中指出其他函数的错误结果。

fun <- function(x, n){
  r <- rle(x)
  n <- length(x)
  x[(n - r$lengths[length(r$lengths)] + 2):n] <- NA
  x
}

x <- c(12,3,3,4,5,6,7,7,7,7,7,7,7,7,7)
fun(x)
#[1] 12  3  3  4  5  6  7 NA NA NA NA NA NA NA NA

y <- c(12,7,7,4,5,6,7,7,7,7,7,7,7,7,7)
fun(y)
#[1] 12  7  7  4  5  6  7 NA NA NA NA NA NA NA NA

Now with a data.frame.

现在有了data.frame。

dat[] <- t(apply(dat, 1, fun))
#  C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15
#1 12  3  3  4  5  6  7 NA NA  NA  NA  NA  NA  NA  NA
#2  1  4  5  5  5  5  5  5  6   7   8  NA  NA  NA  NA
#3  3  4  4  4  4 45 32 57 23  NA  NA  NA  NA  NA  NA

Data.

数据。

dat <- read.csv(text = "
C1,C2,C3,C4,C5,C6,C7,C8,C9,C10,C11,C12,C13,C14,C15
12,3,3,4,5,6,7,7,7,7,7,7,7,7,7
1,4,5,5,5,5,5,5,6,7,8,8,8,8,8
3,4,4,4,4,45,32,57,23,23,23,23,23,23,23
")

#3

Data:

数据：

df1 <- read.table(text='C1,C2,C3,C4,C5,C6,C7,C8,C9,C10,C11,C12,C13,C14,C15
12,3,3,4,5,6,7,7,7,7,7,7,7,7,7
                  1,4,5,5,5,5,5,5,6,7,8,8,8,8,8
                  3,4,4,4,4,45,32,57,23,23,23,23,23,23,23', sep = ",", header = TRUE, stringsAsFactors = FALSE)

Code:

码：

 apply(df1, 1, function(x) {
  x <- rle(x)
  len_x <- length(x$lengths)

  if( (x$lengths)[len_x] > 1 ){ # check for end sequence
    x <- list(lengths = c(x$lengths[-len_x], 1, x$lengths[len_x]- 1 ),
              values = c(x$values, NA))
  } 
  inverse.rle(x)
})

Output:

输出：

#       [,1] [,2] [,3]
# [1,]   12    1    3
# [2,]    3    4    4
# [3,]    3    5    4
# [4,]    4    5    4
# [5,]    5    5    4
# [6,]    6    5   45
# [7,]    7    5   32
# [8,]   NA    5   57
# [9,]   NA    6   23
# [10,]   NA    7   NA
# [11,]   NA    8   NA
# [12,]   NA   NA   NA
# [13,]   NA   NA   NA
# [14,]   NA   NA   NA
# [15,]   NA   NA   NA

#4

Before:

之前：

enter image description here

the code:

代码：

Sub marine()
    For i = 2 To 4
        For j = 15 To 2 Step -1
            If Cells(i, j).Value = Cells(i, j - 1).Value Then
                Cells(i, j).Value = "#N/A"
            Else
                Exit For
            End If
        Next j
    Next i
End Sub

and after:

之后：

enter image description here

#5

this only uses one loop:

这只使用一个循环：

Sub nadup()

With Worksheets("Sheet5") 'change to your sheet
    Dim i As Long
    For i = 2 To 4
        Dim t As Long
        t = Application.Match(.Cells(i, 15), Range(i & ":" & i), 0)
        If t <14 Then
            .Range(.Cells(i, t + 1), .Cells(i, 15)).Value = "N/A"
        ElseIf t = 14 Then
            .Cells(i, 15) = "N/A"
        End If
    Next i
End With



End Sub

#6

With arrays

有阵列

Option Explicit

Public Sub ReplaceItems()
    Dim arr(), arr2(), i As Long, j As Long
    With ActiveSheet
        arr() = .Range("A1:O3").Value
        For i = LBound(arr, 1) To UBound(arr, 1)
            ReDim arr2(1 To UBound(arr, 2))
            For j = LBound(arr, 2) To UBound(arr, 2)
                If IsError(Application.Match(arr(i, j), arr2, 0)) Then
                    arr2(j) = arr(i, j)
                Else
                    Select Case arr(i, j)
                    Case 7, 8, 23
                    arr2(j) = "#N/A"
                    Case Else
                    arr2(j) = arr(i, j)
                    End Select
                End If
            Next
            .Range("A" & i).Resize(1, UBound(arr2)).Value = arr2
        Next i
    End With
End Su

推荐阅读

vba
另存为使用变量名称给出错误 - Save As Using Variable Names Gives Error

Tryingtosaveanew,notyetnamed,workbook(thatIaddedusinganothersub)withvariablesforth ... [详细]

蜡笔小新 2023-09-16 01:33:25
vba
logistic回归（线性和非线性）的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了logistic回归（线性和非线性）相关的知识，包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 21:40:43
case
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
case
php 主动断掉http,怎么在PHP项目中实现一个HTTP断点续传功能

怎么在PHP项目中实现一个HTTP断点续传功能发布时间：2021-01-1916:26:06来源：亿速云阅读：96作者：Le ... [详细]

蜡笔小新 2023-12-12 17:17:29
list
MooTools和JQuery并排 - MooTools and JQuery Side by Side

IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]

蜡笔小新 2023-12-12 13:43:58
config
Summarize function is doing alignment without timezone ?

Hi.Imtryingtogetsummarizefrom00:00otfirstdayofthismonthametric, ... [详细]

蜡笔小新 2023-10-17 20:11:29
config
codeigniter技巧——防止model-controller名字冲突

使用这个技巧要达到的目标：一般来说，模型和控制器你都不会有相同的类名字。让我先创建一个取名为post的model。classPostextendsModel{}现在 ... [详细]

蜡笔小新 2023-10-17 19:12:02
vba
具有可变数量的列的VBA Access 2003表 - VBA Access 2003 table with a variable number of Columns

IhaveatableinAccess2003VBAwith164columnsbutthedataIgethas181columnanditispossi ... [详细]

蜡笔小新 2023-10-10 18:30:13
vba
使用VBA宏更改插入行颜色 - Change insert line color with VBA macro

Codebelowwascreated(notbyme,andsavedas*.dotm)inMicrosoftWord97-2003,whendefaultins ... [详细]

蜡笔小新 2023-09-25 12:30:39
case
手机移动端HTML5和JavaScript如何实现视频上传和压缩视频质量？

本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量，或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频，只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量，只有使用JAVA编写Android客户端才能实现压缩。此外，作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因，并提供了解决方法。最后，作者还介绍了一个用于处理图片的类，可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]

蜡笔小新 2023-12-12 15:58:44
case
动量|收益率_基于MT策略的实战分析

篇首语：本文由编程笔记#小编为大家整理，主要介绍了基于MT策略的实战分析相关的知识，希望对你有一定的参考价值。基于MT策略的实战分析 ... [详细]

蜡笔小新 2023-10-17 15:13:20
list
词向量计算文本相似度,通过词向量求文本相似度

基于词向量计算文本相似度1.测试数据：链接：https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码：f4vx2.实验代码：imp ... [详细]

蜡笔小新 2023-10-17 12:10:15
config
VMware ESXI CLI常用命令

ESXi命令行获取帮助的方法为，常用的命令一般都是以esxcli开头，如果忘记命令可以使用帮助：esxcli-- ... [详细]

蜡笔小新 2023-10-17 11:37:09
list
Tensorflow 训练自己的cnn模型行人识别

代码如下：#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]

蜡笔小新 2023-10-16 16:57:06
vba
如何在同一工作表上运行多个VBA代码

我当前正在运行以下代码：PrivateSubWorksheet_BeforeDoubleClick(ByValTargetAsRange,Cancel ... [详细]

蜡笔小新 2023-09-17 23:08:33

Tags | 热门标签

RankList | 热门文章