最热门的R语言常见面试问题和答案合集

2021年11月28日19:44:46 发表评论 2,017 次浏览

R 编程语言用于统计分析、图形表示和报告。R 在 GNU 通用公共许可证 (GNU GPL) 下免费提供。 GNU GPL 允许最终用户使用该软件并自由运行、共享和使用该软件。R编程语言用于回归分析、预测建模、概率估计、数据挖掘等领域，进一步有助于数据分析。这篇文章将使你可以使用下面列出的最佳R 面试问题和答案为即将到来的 R 面试做准备。

热门的R语言面试问题和答案合集

R编程语言的特点：

R 用于处理大量数据和存储设施。
R 在处理数据的统计分析和图形表示时很方便。
R 提供了大量的运算符来执行对数组、列表、向量和度量的计算。

以下是 R 面试问题列表，可帮助你准备面试并在数据科学领域找到工作。

问题： R 中的数据结构是什么，它有助于统计分析和图形表示？

答：以下是R中广泛使用的数据结构：

Array
矩阵
向量
数据框
列表
表

问题：如何在 R 中打印一些东西？<R基本语法练习>

答：为了写东西，R 使用了打印命令。

>string_variable_name <- “R is an analytical language”
>print(string_variable_name)

问题：什么是 class() 函数 R？

答： R 中的这个函数是一个字符向量，给出对象继承的类的名称。

例子：

>x <- 1:10
>class(x)
[1] “integer”

问题：什么是向量？

答案：向量是具有相同主要类型的数据元素的序列。向量中的成员称为组件。

例子。

>vector_example <- c(2,3,4,5)
> print(vector_example)
[1] 2,3,4,5
>print (length(vector_example)
[1] 4

问题：如何对向量进行算术运算？举例说明

R语言面试题解析： R 中使用了许多算术运算符。请记住，R 使用一个组件一个组件的运算符。让我们用一些标准运算符来看看它。

>x <- c(1,2,3,4)
> y <- c(4,5,6,7)
> x+y
[1] 5 7 9 11
> x-y
[1] -3 -3 -3 -3
> z <- (4,4,4,4,4,4,4)
> x+z
[1] 5 6 7 8 5 6 7

当我们有两个长度不等的向量，并且我们需要对两者进行操作时，那么较短的向量会一次又一次地用于匹配两个向量的长度。

问题：R语言常见面试题有哪些 - 在 Vector 中定义索引。

答：向量中的索引用于给出向量该位置处的元素。很少有编程语言从0开始索引，其他从1开始。R从1开始计算索引。同时放置索引号有很多可能性，即

1. 正指数和区间指数

> x<- (1,3,4,5)
> x[2]
[1] “3”

2. 超出范围

>x <- (2,3,4,5)
> x[110]
[1] NA

3. 负索引 - 删除此元素并回复所有左边的数字。

> x <- (3,4,5,6,7)
> x[-3]
[1] “3” “4” “6” “7”

4. 数值范围

>x <- (3,4,5,6,7,8)
> x[2:5]
[1] “4” “5” “6” “7”

5. 重复索引

>x <- (3,4,5,6,7)
>s[c(2,1,2,3)]
[1] “4” “3” “4” “5”

6. 逻辑索引

如果我们想选择一个特定的一组索引号，那么你应该使用逻辑运算符，即 TRUE 和 FALSE

> x <- (2,3,4,5,6)
> s[c(TRUE, FALSE, FALSE, TRUE, TRUE)
[1] “2” “5” “6”

问题：什么是列表？

答：R语言面试问题和答案合集 - 列表，顾名思义，就是将几个向量集合在一起。假设你有一个数值向量、一个字符向量、一个布尔向量和一些数字。我们想把它合二为一，这显然不会有相同的数据类型。所以我们需要创建一个列表。

> n = c(2,3,5)
> s = c (“a”, “b”, “c”, “d”, “e”)
> b= c(TRUE, FALSE, TRUE, FALSE, FALSE)
> x = list (n, s, b, 3)
> print(x)
[[1]]
[1] 2 3 5
[[2]]
[1] “a” “b” “c” “d” “e”
[[3]]
[1] TRUE FALSE TRUE FALSE FALSE
[[4]]
[1] 3

问题：什么是矩阵？

答：矩阵是二维矩形数据集。它可以使用矩阵函数的向量输入来创建。

例子。

# Matrix creation
> M = matrix(c(1,2,3,4,5,6), nrow=2, ncol=3, by-row =TRUE)
print(M)
[1] [2] [3]
[1] 1 2 3
[1] 4 5 6
Where
nrow = number of rows in the matrix
ncol = number of columns in the matrix
byrow = TRUE/FALSE will get value first by row or column.

问题：什么是数组？

R语言面试题解析：数组是矩阵的超集。一方面，矩阵可以是二维的，但数组可以是任意维数。

例子。

> a<- array(c(“car”, “bike”), dim (3,3,2))
> print (a)
, , 1
[,1] [,2] [,3]
[1,] “car” “bike” “car”
[2,] “bike” “car” “bike”
[3,] “car” “bike” “car”
, , 2
[,1] [,2] [,3]
[1,] “bike” “car” “bike”
[2,] “car” “bike” “car”
[3,] “bike” “car” “bike”
>my_array <- array(1:24, dim = c(3,4,2))
< my_array
, , 1
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
, , 2
[,1] [,2] [,3] [,4]
[1,] 13 16 19 22
[2,] 14 17 20 23
[3,] 15 18 21 24

问题：是什么因素？

答案：因子是使用向量创建的 r 对象。R 中的因子存储为整数值向量，其中包含一组相应的字符值，以便在显示因子时使用。因子函数用于创建因子。factor 唯一需要的参数是一个向量值，它将作为因子值的向量返回。它将向量与向量标签中元素的不同值一起存储。

因子是使用 factor() 函数创建的。nlevels 函数给出了级别的计数。

例子。

#First let’s create a vector
>vector_example <- c(‘a’, ‘b’, ‘c’, ‘a’, ‘a’)
#Now create a factor object
>factor_example <- factor(vector_example)
>print(factor_example)
[1] a b c a a
>print(nlevels(factor_example))
[1] 3

nlevels 为你提供向量中不同值的数量。

问题：矩阵和数组有什么区别？

答：矩阵只能有两个维度，而数组可以有任意多的维度。矩阵是在数据、行数、列数以及元素是按行还是按列放置的帮助下定义的。

在数组中，你需要给出数组的维度。数组可以是任意维数，每一维都是一个矩阵。例如，一个 3x3x2 数组表示两个矩阵，每个矩阵的维度为 3x3。

问题：什么是数据框？

答：该数据帧是相等长度的向量的列表。它可以由具有特定类型的任何向量组成，并且可以将其合并为一个。因此，一个数据框可以有一个逻辑向量和另一个数字向量。唯一的条件是所有向量都应该具有相同的长度。

例子。

#This is how the data frame is created
> student_profile <- data.frame(
Name <-c(“Ray”, “Green”, “Justin”)
Age <- c(22,23,24)
Class <- c(6,7,8)
)
print(stuent_profile)

上面的代码将创建三个列，列名称为 name、age 和 class。

问题：矩阵和数据框有什么区别？

答：数据框可以包含具有不同输入的向量，而矩阵不能。我们可以有一个包含字符、整数甚至其他数据框的数据框，但是你不能用矩阵来做到这一点，因为矩阵必须都是相同的类型。

因此，数据框可以具有不同的字符、数字和逻辑向量。

但是，对于矩阵，我们只需要一种数据类型。

问题：如何在 R 中读取用户的输入？

回答：

Readinteger <- function()
{
n <- readline(prompt = “Enter an integer: “)
return(as.integer(n))
}
print(readinteger())

Readline 允许用户在 R 中输入一行字符串。

prompt 参数打印在用户的屏幕上。

问题：写一个函数来求一个数的平方

回答：

Square <- function(x) {
return(x^2)
}
print(Square(4))

问题：用 R 写一个倒计时函数？

回答：

timer <- function(time)
{
print(time)
while(time!-0)
{
Sys.sleep(!)
Time <- time -1
print(time)
}
}
countdown(5)
[1] 5
[2] 4
[3] 3
[2] 2
[1] 1

问题：如何在 R 中使用模式函数？

答：R语言常见面试题有哪些 - 众数是一组数据中出现次数最多的值。与均值和中位数不同，众数可以同时包含数字和字符数据。

R 没有标准的内置函数来计算模式。因此，我们创建了一个用户函数来计算 R 中数据集的众数。该函数将向量作为输入并给出众数作为输出。

例子。

#Create the function
getmode <- function(v){
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v,uniqv)))]
}
#Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
#Calculate the mode using the user function
result <- getmode(v)
print(result)
[1] 2
#Create the vector with characters
charv <- c(“o”, “it”, “the”, “it”, “it”)
#Calculate the mode using the user function.
result <- getmode(charv)
print(result)
[1] “it”

问题：登记功能有什么作用？

答案：它将列表转换为向量

问题： R 中的 apply 函数是什么？

答： apply()，它的家族是R中最常用的函数之一。当我们想对矩阵的行或列应用一个函数时，我们使用apply。

例子：

M<- matrix(seq(1,16),4,4)
apply (M,1,min)
[1] 1 2 3 4

问题： R 中的 lapply() 函数是什么？

答： lapply() 函数用于当我们想对每个函数应用一个函数时

问题： lapply 和 sapply 的区别

答：R语言面试问题和答案合集 - 如果程序员希望输出是数据帧或向量，则使用 sapply 函数，而如果程序员希望输出是列表，则使用 lapply 。

问题：如何在 R 中安装新包？

答：我们需要知道包的名称

句法：

install.packages(“name_of_package”)

问题： merge() 函数的作用是什么？

答：我们可以使用合并函数()合并两个数据框。数据框必须具有与发生合并相同的列名。

例子。

df1 <- data.frame(id <- c(1:6), name <-c(rep(“Amit”,3), rep(“Sumit”,3))
df2 < - data.frame(id <- c(7,8,9), name <- c(rep(“Nitin”,2),rep(“Paplu”,1))
*outer join
merge(x=df1, y= df2, by =”id”, all TRUE)

这 all = TRUE 将为你提供外连接，因此新数据集将具有合并在 id 上的两个数据帧的所有值。

问题：什么是数据清洗？

答：数据清理是分析中的一个过程，涉及删除或修改数据库中不正确、不完整、格式不正确或重复的数据。

问题：什么是数据重塑？

R语言面试题解析：有时，我们需要特定格式的数据。最初，我们从数据框中的特定 .csv 文件或 txt 文件导入数据。但是，大多数时候我们还需要一个不同于初始数据集的数据集，另外我们还需要添加列或列的位置。所以所有这些都是数据重塑，你可以根据需要给出初始数据框的形状。

问题：在 R 中编写一个函数将两个数字相加

回答：

add <- function(a,b)
{
c <- a+b
print(c)
}

问题：如何从命令行关闭 R？

答案：使用函数 q()

问题：如何读取 R 中的 csv_input 文件？

回答：

data <- read.csv(“csv_input.csv”)

问题：解释一下 R 中扫描函数的使用。

答： scan() 函数用于读取各种类型的数据或数据对象，例如数据向量。可以自定义该命令以读取特定数据。该命令等待来自数据的输入，然后返回在提示符处输入的值。

问题：在 R 编程语言中使用哪些不同的文件格式？

回答：

.RDA 文件格式：这些是用于在 R 中附加和加载文件的 R 对象。
.Rfiles：这些是由转储函数在 R 编辑器中创建的文件。
.txt 文件：.txt 文件用于存储数据集。R 使用 read.table() 和 write.table() 函数。
.csv 文件：逗号分隔值文件是常见的数据文件。

问题： od summary() 函数是什么函数？

答： summary() 是一个重要的命令，可以帮助我们获取数据的统计摘要。它包含所有统计数据，如均值、中值、最小值、最大值、第一四分位数和第三四分位数。

问题：如何在 R 中添加数据集？

答： rbind() 函数可用于添加 R 语言中的数据集，前提是数据集中的列应该相同。

问题： R语言中的因子变量有哪些？

答案：因子变量是包含字符串或数值的分类变量。因子变量用于各种类型的图形，特别是用于统计建模，其中分配了正确的自由度数。

问题： R 中的 seq() 函数有什么用？

答： R 中的 seq() 函数用于为用户提供一个数字序列。如果我们需要一个具有特定步骤的数字序列，即 4,8,12,16，那么我们需要提供另一个属性“by = ?” 这将提供步骤。

例子。

> print(seq(5,11, by = 2))

[1] 5,7,9,11

问题：定义重复循环

答案：重复循环多次执行一系列语句。它不会将条件放在我们放置关键字重复的同一位置。

例子。

>name <-c(“Parry”,”John”)
>temp <-5
> repeat {
print(name)
temp <- temp +2
if(temp >11){
Break
}
}

这将返回名称向量四次。首先，它打印名称并将温度增加到 7，依此类推。

问题：如何在 R 中进行决策？

答： R 中的决策执行方式与其他语言中的执行方式相同。三个主要的决策声明包含：

如果语句
If.else 语句
开关语句

问题：存在两个向量，a <- (3,4,5) 和 b <- (1,2)，那么 c <- a * b 的输出是什么？

答案： c<- (3,8,5)

问题： R 中有哪些二元函数可以应用二元运算符？

答案：标量、矩阵和向量

问题：数据框的主要特征是什么？

答：R语言面试问题和答案合集- 主要有以下几个特点：

行名称应该是唯一的。
列名不能为空
数据框中存储的数据仅支持三种类型，即数字、因子和字符。
每列应具有相同数量的数据项。这是数据框的主要规则之一。

问题：解释R中字符串函数的使用

答： R 中的 str() 函数用于获取数据框的结构以及前几个观察结果。假设一个数据框有四个变量，每个变量有三个值。然后这个函数的输出将是这样的：

‘data.frame’: 3 obs. And 4 variable
$name: chr “Nitin” “Kamal” “Xtramous”
$age : int 16 18 20
$class: int 6 8 10

问题： seq(4) 和 seq_along(4) 有什么区别

答案： seq(4) 产生一个从 1 到 4 (c(1,2,3,4)) 的向量，而 seq_along(4) 产生一个长度为 (4) 或 1(c(1)) 的向量。

问题：如何在 R 中读取 .csv 文件？

答： read.csv() 函数用于从当前工作目录读取 CSV（逗号分隔值）。

例子。

data_store<- read.csv(“abc.csv”)
print(data_store)

问题：获取工资最高的人的所有数据。

回答：

max_salary_person <- subset(data,
salary == max(salary))
print(max_salary_person)

问题：如何获得外连接、左连接、右连接、内连接和交叉连接？

回答：

outer join - merge (x= df1, y=df2, by= “id”, all= TRUE)
left join - merge (x= df1, y= df2, by = “id”, all.x = TRUE)
right join - merge (x= df1, y= df2, by = “id”, all.y = TRUE)
inner join - merge (x= df1, y= df2, by = “id”)
cross join - merge (x= df1, y= df2, by = NULL)

问题：你说的铸造是什么意思？cast() 函数有什么用？

答：R语言常见面试题有哪些 - 用于在melt()之后得到聚合体。所以，现在我们已经按某种顺序排列了数据，如果我们想聚合具有相似 company_name 和 age 的列，那么我们应该使用 cast() 函数。

例子。

Casted_data_set <- cast(new_data_set, company_name+age ~ variable, sum)

该函数给出了具有相同公司和年龄的儿童的总工资和数量。

问题：示例函数在R编程中有什么用？

答： Sample() 函数可用于从庞大的数据集中选择大小为“n”的随机样本。

问题：子集函数在R编程中有什么用？

答： Subset() 函数用于从给定的数据集中选择变量和观察值。

问题： rnorm() 函数的作用是什么？用语法解释。

答案： rnorm 函数根据传递给函数的均值和标准差参数生成“n”个正态随机数。

句法：

rnorm(n, mean = , sd= )

问题：如何在 R 中制作散点图？

R语言面试题解析：散点图是一个图表，它显示了在笛卡尔平面上绘制的许多点。每个点都包含 x 轴和 y 轴上的两个值。使用 plot() 函数绘制简单的散点图。

散点图的语法是：

plot(x,y,main,xlab,ylab,xlim,ylim,axes)

其中

x 是其值为水平坐标的数据集

y 是其值为垂直坐标的数据集

主要是图中的瓷砖

xlab 和 ylab 是横纵轴的标签

xlim 和 ylim 是绘图中使用的 x 和 y 值的限制

轴指示是否两个轴都应该在绘图上。

plot(x = input$wt,y = input$mpg,
xlab = “Weight”,
ylab = “Mileage”,
xlim = c(2.5,5)
ylim = c(15,30)
main = “Weight vs Mileage”
)

问题： R 中的 sink 函数是什么？

答： sink() 函数定义了输出的方向。

#direct output to a file
sink(“myfile”, append = FALSE, split = FALSE)
#return output to the terminal sink()

append 选项控制输出是覆盖还是添加到文件中。split 选项确定输出是否也作为输出文件发送到屏幕。

R语言面试问题和答案合集概括

我们为你提供了流行的 R 编程面试问题，为你准备数据科学面试。这些 R 面试问题是最好的面试问题集。我们还建议你在参加面试之前练习编码，并且拥有一个你参与过的虚拟项目总是一个加分项。你在面试中还有其他问题吗？或者你想与 R 社区分享的任何其他技巧？

热门的R语言面试问题和答案合集

问题： R 中的数据结构是什么，它有助于统计分析和图形表示？

问题：如何在 R 中打印一些东西？<R基本语法练习>

问题：什么是 class() 函数 R？

问题：什么是向量？

问题：如何对向量进行算术运算？举例说明

问题：R语言常见面试题有哪些 - 在 Vector 中定义索引。

问题：什么是列表？

问题：什么是矩阵？

问题：什么是数组？

问题：是什么因素？

问题：矩阵和数组有什么区别？

问题：什么是数据框？

问题：矩阵和数据框有什么区别？

问题：如何在 R 中读取用户的输入？

问题：写一个函数来求一个数的平方

问题：用 R 写一个倒计时函数？

问题：如何在 R 中使用模式函数？

问题：登记功能有什么作用？

问题： R 中的 apply 函数是什么？

问题： R 中的 lapply() 函数是什么？

问题： lapply 和 sapply 的区别

问题：如何在 R 中安装新包？

问题： merge() 函数的作用是什么？

问题：什么是数据清洗？

问题：什么是数据重塑？

问题：在 R 中编写一个函数将两个数字相加

问题：如何从命令行关闭 R？

问题：如何读取 R 中的 csv_input 文件？

问题：解释一下 R 中扫描函数的使用。

问题：在 R 编程语言中使用哪些不同的文件格式？

问题： od summary() 函数是什么函数？

问题：如何在 R 中添加数据集？

问题： R语言中的因子变量有哪些？

问题： R 中的 seq() 函数有什么用？

问题：定义重复循环

问题：如何在 R 中进行决策？

问题：存在两个向量，a <- (3,4,5) 和 b <- (1,2)，那么 c <- a * b 的输出是什么？

问题： R 中有哪些二元函数可以应用二元运算符？

问题：数据框的主要特征是什么？

问题：解释R中字符串函数的使用

问题： seq(4) 和 seq_along(4) 有什么区别

问题：如何在 R 中读取 .csv 文件？

问题：获取工资最高的人的所有数据。

问题：如何获得外连接、左连接、右连接、内连接和交叉连接？

问题：你说的铸造是什么意思？cast() 函数有什么用？

问题：示例函数在R编程中有什么用？

问题：子集函数在R编程中有什么用？

问题： rnorm() 函数的作用是什么？用语法解释。

问题：如何在 R 中制作散点图？

问题： R 中的 sink 函数是什么？

R语言面试问题和答案合集概括

发表评论取消回复

登录 注册 找回密码

登录注册找回密码