R 编程语言用于统计分析、图形表示和报告。R 在 GNU 通用公共许可证 (GNU GPL) 下免费提供。 GNU GPL 允许最终用户使用该软件并自由运行、共享和使用该软件。R编程语言用于回归分析、预测建模、概率估计、数据挖掘等领域,进一步有助于数据分析。这篇文章将使你可以使用下面列出的最佳R 面试问题和答案为即将到来的 R 面试做准备。
热门的R语言面试问题和答案合集
R编程语言的特点:
- R 用于处理大量数据和存储设施。
- R 在处理数据的统计分析和图形表示时很方便。
- R 提供了大量的运算符来执行对数组、列表、向量和度量的计算。
以下是 R 面试问题列表,可帮助你准备面试并在数据科学领域找到工作。
问题: R 中的数据结构是什么,它有助于统计分析和图形表示?
答:以下是R中广泛使用的数据结构:
- Array
- 矩阵
- 向量
- 数据框
- 列表
- 表
问题:如何在 R 中打印一些东西?<R基本语法练习>
答:为了写东西,R 使用了打印命令。
>string_variable_name <- “R is an analytical language”
>print(string_variable_name)
问题:什么是 class() 函数 R?
答: R 中的这个函数是一个字符向量,给出对象继承的类的名称。
例子:
>x <- 1:10
>class(x)
[1] “integer”
问题:什么是向量?
答案:向量是具有相同主要类型的数据元素的序列。向量中的成员称为组件。
例子。
>vector_example <- c(2,3,4,5)
> print(vector_example)
[1] 2,3,4,5
>print (length(vector_example)
[1] 4
问题:如何对向量进行算术运算?举例说明
R语言面试题解析: R 中使用了许多算术运算符。请记住,R 使用一个组件一个组件的运算符。让我们用一些标准运算符来看看它。
>x <- c(1,2,3,4)
> y <- c(4,5,6,7)
> x+y
[1] 5 7 9 11
> x-y
[1] -3 -3 -3 -3
> z <- (4,4,4,4,4,4,4)
> x+z
[1] 5 6 7 8 5 6 7
当我们有两个长度不等的向量,并且我们需要对两者进行操作时,那么较短的向量会一次又一次地用于匹配两个向量的长度。
问题:R语言常见面试题有哪些 - 在 Vector 中定义索引。
答:向量中的索引用于给出向量该位置处的元素。很少有编程语言从0开始索引,其他从1开始。R从1开始计算索引。同时放置索引号有很多可能性,即
1. 正指数和区间指数
> x<- (1,3,4,5)
> x[2]
[1] “3”
2. 超出范围
>x <- (2,3,4,5)
> x[110]
[1] NA
3. 负索引 - 删除此元素并回复所有左边的数字。
> x <- (3,4,5,6,7)
> x[-3]
[1] “3” “4” “6” “7”
4. 数值范围
>x <- (3,4,5,6,7,8)
> x[2:5]
[1] “4” “5” “6” “7”
5. 重复索引
>x <- (3,4,5,6,7)
>s[c(2,1,2,3)]
[1] “4” “3” “4” “5”
6. 逻辑索引
如果我们想选择一个特定的一组索引号,那么你应该使用逻辑运算符,即 TRUE 和 FALSE
> x <- (2,3,4,5,6)
> s[c(TRUE, FALSE, FALSE, TRUE, TRUE)
[1] “2” “5” “6”
问题:什么是列表?
答:R语言面试问题和答案合集 - 列表,顾名思义,就是将几个向量集合在一起。假设你有一个数值向量、一个字符向量、一个布尔向量和一些数字。我们想把它合二为一,这显然不会有相同的数据类型。所以我们需要创建一个列表。
> n = c(2,3,5)
> s = c (“a”, “b”, “c”, “d”, “e”)
> b= c(TRUE, FALSE, TRUE, FALSE, FALSE)
> x = list (n, s, b, 3)
> print(x)
[[1]]
[1] 2 3 5
[[2]]
[1] “a” “b” “c” “d” “e”
[[3]]
[1] TRUE FALSE TRUE FALSE FALSE
[[4]]
[1] 3
问题:什么是矩阵?
答:矩阵是二维矩形数据集。它可以使用矩阵函数的向量输入来创建。
例子。
# Matrix creation
> M = matrix(c(1,2,3,4,5,6), nrow=2, ncol=3, by-row =TRUE)
print(M)
[1] [2] [3]
[1] 1 2 3
[1] 4 5 6
Where
nrow = number of rows in the matrix
ncol = number of columns in the matrix
byrow = TRUE/FALSE will get value first by row or column.
问题:什么是数组?
R语言面试题解析:数组是矩阵的超集。一方面,矩阵可以是二维的,但数组可以是任意维数。
例子。
> a<- array(c(“car”, “bike”), dim (3,3,2))
> print (a)
, , 1
[,1] [,2] [,3]
[1,] “car” “bike” “car”
[2,] “bike” “car” “bike”
[3,] “car” “bike” “car”
, , 2
[,1] [,2] [,3]
[1,] “bike” “car” “bike”
[2,] “car” “bike” “car”
[3,] “bike” “car” “bike”
>my_array <- array(1:24, dim = c(3,4,2))
< my_array
, , 1
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
, , 2
[,1] [,2] [,3] [,4]
[1,] 13 16 19 22
[2,] 14 17 20 23
[3,] 15 18 21 24
问题:是什么因素?
答案:因子是使用向量创建的 r 对象。R 中的因子存储为整数值向量,其中包含一组相应的字符值,以便在显示因子时使用。因子函数用于创建因子。factor 唯一需要的参数是一个向量值,它将作为因子值的向量返回。它将向量与向量标签中元素的不同值一起存储。
因子是使用 factor() 函数创建的。nlevels 函数给出了级别的计数。
例子。
#First let’s create a vector
>vector_example <- c(‘a’, ‘b’, ‘c’, ‘a’, ‘a’)
#Now create a factor object
>factor_example <- factor(vector_example)
>print(factor_example)
[1] a b c a a
>print(nlevels(factor_example))
[1] 3
nlevels 为你提供向量中不同值的数量。
问题:矩阵和数组有什么区别?
答:矩阵只能有两个维度,而数组可以有任意多的维度。矩阵是在数据、行数、列数以及元素是按行还是按列放置的帮助下定义的。
在数组中,你需要给出数组的维度。数组可以是任意维数,每一维都是一个矩阵。例如,一个 3x3x2 数组表示两个矩阵,每个矩阵的维度为 3x3。
问题:什么是数据框?
答:该数据帧是相等长度的向量的列表。它可以由具有特定类型的任何向量组成,并且可以将其合并为一个。因此,一个数据框可以有一个逻辑向量和另一个数字向量。唯一的条件是所有向量都应该具有相同的长度。
例子。
#This is how the data frame is created
> student_profile <- data.frame(
Name <-c(“Ray”, “Green”, “Justin”)
Age <- c(22,23,24)
Class <- c(6,7,8)
)
print(stuent_profile)
上面的代码将创建三个列,列名称为 name、age 和 class。
问题:矩阵和数据框有什么区别?
答:数据框可以包含具有不同输入的向量,而矩阵不能。我们可以有一个包含字符、整数甚至其他数据框的数据框,但是你不能用矩阵来做到这一点,因为矩阵必须都是相同的类型。
因此,数据框可以具有不同的字符、数字和逻辑向量。
但是,对于矩阵,我们只需要一种数据类型。
问题:如何在 R 中读取用户的输入?
回答:
Readinteger <- function()
{
n <- readline(prompt = “Enter an integer: “)
return(as.integer(n))
}
print(readinteger())
Readline 允许用户在 R 中输入一行字符串。
prompt 参数打印在用户的屏幕上。
问题:写一个函数来求一个数的平方
回答:
Square <- function(x) {
return(x^2)
}
print(Square(4))
问题:用 R 写一个倒计时函数?
回答:
timer <- function(time)
{
print(time)
while(time!-0)
{
Sys.sleep(!)
Time <- time -1
print(time)
}
}
countdown(5)
[1] 5
[2] 4
[3] 3
[2] 2
[1] 1
问题:如何在 R 中使用模式函数?
答:R语言常见面试题有哪些 - 众数是一组数据中出现次数最多的值。与均值和中位数不同,众数可以同时包含数字和字符数据。
R 没有标准的内置函数来计算模式。因此,我们创建了一个用户函数来计算 R 中数据集的众数。该函数将向量作为输入并给出众数作为输出。
例子。
#Create the function
getmode <- function(v){
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v,uniqv)))]
}
#Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
#Calculate the mode using the user function
result <- getmode(v)
print(result)
[1] 2
#Create the vector with characters
charv <- c(“o”, “it”, “the”, “it”, “it”)
#Calculate the mode using the user function.
result <- getmode(charv)
print(result)
[1] “it”
问题:登记功能有什么作用?
答案:它将列表转换为向量
问题: R 中的 apply 函数是什么?
答: apply(),它的家族是R中最常用的函数之一。当我们想对矩阵的行或列应用一个函数时,我们使用apply。
例子:
M<- matrix(seq(1,16),4,4)
apply (M,1,min)
[1] 1 2 3 4
问题: R 中的 lapply() 函数是什么?
答: lapply() 函数用于当我们想对每个函数应用一个函数时
问题: lapply 和 sapply 的区别
答:R语言面试问题和答案合集 - 如果程序员希望输出是数据帧或向量,则使用 sapply 函数,而如果程序员希望输出是列表,则使用 lapply 。
问题:如何在 R 中安装新包?
答:我们需要知道包的名称
句法:
install.packages(“name_of_package”)
问题: merge() 函数的作用是什么?
答:我们可以使用合并函数()合并两个数据框。数据框必须具有与发生合并相同的列名。
例子。
df1 <- data.frame(id <- c(1:6), name <-c(rep(“Amit”,3), rep(“Sumit”,3))
df2 < - data.frame(id <- c(7,8,9), name <- c(rep(“Nitin”,2),rep(“Paplu”,1))
*outer join
merge(x=df1, y= df2, by =”id”, all TRUE)
这 all = TRUE 将为你提供外连接,因此新数据集将具有合并在 id 上的两个数据帧的所有值。
问题:什么是数据清洗?
答:数据清理是分析中的一个过程,涉及删除或修改数据库中不正确、不完整、格式不正确或重复的数据。
问题:什么是数据重塑?
R语言面试题解析:有时,我们需要特定格式的数据。最初,我们从数据框中的特定 .csv 文件或 txt 文件导入数据。但是,大多数时候我们还需要一个不同于初始数据集的数据集,另外我们还需要添加列或列的位置。所以所有这些都是数据重塑,你可以根据需要给出初始数据框的形状。
问题:在 R 中编写一个函数将两个数字相加
回答:
add <- function(a,b)
{
c <- a+b
print(c)
}
问题:如何从命令行关闭 R?
答案:使用函数 q()
问题:如何读取 R 中的 csv_input 文件?
回答:
data <- read.csv(“csv_input.csv”)
问题:解释一下 R 中扫描函数的使用。
答: scan() 函数用于读取各种类型的数据或数据对象,例如数据向量。可以自定义该命令以读取特定数据。该命令等待来自数据的输入,然后返回在提示符处输入的值。
问题:在 R 编程语言中使用哪些不同的文件格式?
回答:
- .RDA 文件格式:这些是用于在 R 中附加和加载文件的 R 对象。
- .Rfiles:这些是由转储函数在 R 编辑器中创建的文件。
- .txt 文件:.txt 文件用于存储数据集。R 使用 read.table() 和 write.table() 函数。
- .csv 文件:逗号分隔值文件是常见的数据文件。
问题: od summary() 函数是什么函数?
答: summary() 是一个重要的命令,可以帮助我们获取数据的统计摘要。它包含所有统计数据,如均值、中值、最小值、最大值、第一四分位数和第三四分位数。
问题:如何在 R 中添加数据集?
答: rbind() 函数可用于添加 R 语言中的数据集,前提是数据集中的列应该相同。
问题: R语言中的因子变量有哪些?
答案:因子变量是包含字符串或数值的分类变量。因子变量用于各种类型的图形,特别是用于统计建模,其中分配了正确的自由度数。
问题: R 中的 seq() 函数有什么用?
答: R 中的 seq() 函数用于为用户提供一个数字序列。如果我们需要一个具有特定步骤的数字序列,即 4,8,12,16,那么我们需要提供另一个属性“by = ?” 这将提供步骤。
例子。
> print(seq(5,11, by = 2))
[1] 5,7,9,11
问题:定义重复循环
答案:重复循环多次执行一系列语句。它不会将条件放在我们放置关键字重复的同一位置。
例子。
>name <-c(“Parry”,”John”)
>temp <-5
> repeat {
print(name)
temp <- temp +2
if(temp >11){
Break
}
}
这将返回名称向量四次。首先,它打印名称并将温度增加到 7,依此类推。
问题:如何在 R 中进行决策?
答: R 中的决策执行方式与其他语言中的执行方式相同。三个主要的决策声明包含:
- 如果语句
- If.else 语句
- 开关语句
问题:存在两个向量,a <- (3,4,5) 和 b <- (1,2),那么 c <- a * b 的输出是什么?
答案: c<- (3,8,5)
问题: R 中有哪些二元函数可以应用二元运算符?
答案:标量、矩阵和向量
问题:数据框的主要特征是什么?
答:R语言面试问题和答案合集- 主要有以下几个特点:
- 行名称应该是唯一的。
- 列名不能为空
- 数据框中存储的数据仅支持三种类型,即数字、因子和字符。
- 每列应具有相同数量的数据项。这是数据框的主要规则之一。
问题:解释R中字符串函数的使用
答: R 中的 str() 函数用于获取数据框的结构以及前几个观察结果。假设一个数据框有四个变量,每个变量有三个值。然后这个函数的输出将是这样的:
‘data.frame’: 3 obs. And 4 variable
$name: chr “Nitin” “Kamal” “Xtramous”
$age : int 16 18 20
$class: int 6 8 10
问题: seq(4) 和 seq_along(4) 有什么区别
答案: seq(4) 产生一个从 1 到 4 (c(1,2,3,4)) 的向量,而 seq_along(4) 产生一个长度为 (4) 或 1(c(1)) 的向量。
问题:如何在 R 中读取 .csv 文件?
答: read.csv() 函数用于从当前工作目录读取 CSV(逗号分隔值)。
例子。
data_store<- read.csv(“abc.csv”)
print(data_store)
问题:获取工资最高的人的所有数据。
回答:
max_salary_person <- subset(data,
salary == max(salary))
print(max_salary_person)
问题:如何获得外连接、左连接、右连接、内连接和交叉连接?
回答:
outer join - merge (x= df1, y=df2, by= “id”, all= TRUE)
left join - merge (x= df1, y= df2, by = “id”, all.x = TRUE)
right join - merge (x= df1, y= df2, by = “id”, all.y = TRUE)
inner join - merge (x= df1, y= df2, by = “id”)
cross join - merge (x= df1, y= df2, by = NULL)
问题:你说的铸造是什么意思?cast() 函数有什么用?
答:R语言常见面试题有哪些 - 用于在melt()之后得到聚合体。所以,现在我们已经按某种顺序排列了数据,如果我们想聚合具有相似 company_name 和 age 的列,那么我们应该使用 cast() 函数。
例子。
Casted_data_set <- cast(new_data_set, company_name+age ~ variable, sum)
该函数给出了具有相同公司和年龄的儿童的总工资和数量。
问题:示例函数在R编程中有什么用?
答: Sample() 函数可用于从庞大的数据集中选择大小为“n”的随机样本。
问题:子集函数在R编程中有什么用?
答: Subset() 函数用于从给定的数据集中选择变量和观察值。
问题: rnorm() 函数的作用是什么?用语法解释。
答案: rnorm 函数根据传递给函数的均值和标准差参数生成“n”个正态随机数。
句法:
rnorm(n, mean = , sd= )
问题:如何在 R 中制作散点图?
R语言面试题解析:散点图是一个图表,它显示了在笛卡尔平面上绘制的许多点。每个点都包含 x 轴和 y 轴上的两个值。使用 plot() 函数绘制简单的散点图。
散点图的语法是:
plot(x,y,main,xlab,ylab,xlim,ylim,axes)
其中
x 是其值为水平坐标的数据集
y 是其值为垂直坐标的数据集
主要是图中的瓷砖
xlab 和 ylab 是横纵轴的标签
xlim 和 ylim 是绘图中使用的 x 和 y 值的限制
轴指示是否两个轴都应该在绘图上。
plot(x = input$wt,y = input$mpg,
xlab = “Weight”,
ylab = “Mileage”,
xlim = c(2.5,5)
ylim = c(15,30)
main = “Weight vs Mileage”
)
问题: R 中的 sink 函数是什么?
答: sink() 函数定义了输出的方向。
#direct output to a file
sink(“myfile”, append = FALSE, split = FALSE)
#return output to the terminal sink()
append 选项控制输出是覆盖还是添加到文件中。split 选项确定输出是否也作为输出文件发送到屏幕。
R语言面试问题和答案合集概括
我们为你提供了流行的 R 编程面试问题,为你准备数据科学面试。这些 R 面试问题是最好的面试问题集。我们还建议你在参加面试之前练习编码,并且拥有一个你参与过的虚拟项目总是一个加分项。你在面试中还有其他问题吗?或者你想与 R 社区分享的任何其他技巧?