rust编程入门实战与进阶(从高级程序员的角度来看)
作者 | Daniel Bulant
译者 | 弯月
出品 | CSDN(ID:CSDNnews)
刚开始从事编程工作的时候,我使用的是PHP。个人感觉,PHP的语法有点笨拙且不自然,有时甚至很讨厌(为什么我必须在每个变量前加上 $ 前缀?常量前面没有$,它不是照样能理解吗?)在学习了其他语言之后,我就不喜欢PHP了,但PHP的有些地方还是还招人喜欢的,比如数组循环很容易,而且还有多种编程范式:函数式、面向对象以及trait等。
后来,我又学习了JS,它很像C语言,而且随处可见。期间,我也做过一些Java和C#的项目,但后来还是回到了JS。
我也尝试过学习C(和 C ),虽然获得了Sololearn的证书,但是我从未真正使用过这两种语言,它们看上去似乎很复杂:快速访问内存的功能很酷,但为什么我必须使用free?为什么它不知道超出作用域时,应该自动释放内存呢?
所以,我还是比较喜欢使用JS编程,因为我无需考虑内存的问题。而且,如今与IO相关的操作也不会限制V8的速度。
后来,我听说了Rust,这门语言由Mozilla开发,多年来一直雄踞StackOverflow最受喜欢编程语言的榜首,甚至超过了我十分喜爱的Typescript(我之所以喜欢Typescript,主要是因为类型安全)。所以,我就想着应该找机会试一试。
学习资源
我遇到的一大难题是,寻找方便理解且简短的好资源。我不喜欢 youtube 视频,我更喜欢快速浏览一些文档,或者在通勤路上阅读一些学习资源,而且无需耗费大量流量。
以下是我找到的资源列表:
● 《The Rust Programming Language》(https://doc.rust-lang.org/book/):这是一本在线书籍,其中介绍了可以利用Rust实现的最常见的功能。
● 《A Gentle Introduction To Rust》(https://stevedonovan.github.io/rust-gentle-intro/):一本简短的书,可以在一两个小时内读完,然后再拿出一两天的时间尝试一下示例。文中涉及的内容比较深入,但很容易掌握。
● https://www.reddit.com/r/rust/:这是一个reddit 社区(如果你遇到比较复杂的问题,则可以发布在此处,等待其他人解答。)
● discord社区:你可以通过这个社区向其他开发人员请教有关Rust的问题。
● Rust By Example(https://doc.rust-lang.org/rust-by-example/index.html):其中介绍了一些示例,可以作为入门首选书。
入门
参照Rust网站(https://www.rust-lang.org/)上的说明,使用rustup即可。
如果想创建一个新项目,请运行 cargo init <dir>(如果位于一个空目录内,则不需要指定 <dir>)。
然后即可从src/main.rs开始编写。
与 C 类似,主程序都包装在 main 中。不同之处在于,它不接受任何参数,也不应该返回一个整数,这些功能应该使用命名空间std::env。
另外,我推荐使用CLion并安装Rust扩展。VSCode 也有 Rust 扩展,但相比之下它的效果很差。当然你可以使用其他的JetBrains编辑器,但 CLion 具有其他编辑器没有的一些原生功能(比如调试)。拥有 GitHub 教育包的学生可以免费使用该插件。
有趣的注意事项
-
一切都有作用域
不仅是变量,就连函数和trait内部也可以使用嵌套函数和use。这些无法从外部访问,而且如果不使用就不会出现在代码中。至少我是这样认为的。
-
必须遵守的命名方案
变量和函数/方法只能使用小写字母、数字和下划线,比如snake_case,但数字不能放在开头。
结构(和其他类型)、枚举(包括枚举值)和trait(但不包括它们的函数/方法)需要以大写字母开头,并且不能包含任何下划线。
-
没有增量运算符
实际上有,你可以使用i = 1。与赋值相同,该表达式将返回赋值后的值(即,将 i 设置为 i 1,然后返回 i)。
没有 i (或者 i、i-- 和 --i),因为这些运算符有点混乱。
你确定如下操作的结果吗(尤其是在没有指定语言的情况下)?
a[i i] = i i a[ i]
问题在于,直到最近上述运算的实际行为还是未定义的,这意味着不同的编译器(甚至可能是同一个编译器的不同版本)可能会产生不同的行为。为了解决这个问题并提高代码的可读性(Rust非常重视可读性和冗长,甚至不惜多敲几次键盘),Rust仅支持 i = 1,几乎所有人都知道该表达式的意思是变量i加1,并返回最终结果。所以,你不必知道 i 实际上返回的是原始值(不是新值),而且还会加1。
此外,运算符重载会使用trait,但本文不打算详细讨论。
-
几乎所有的东西都是表达式
除了函数调用之外,还有 if、while、match 和 for 都是表达式。
你可以直接使用 if 来代替其他语言中常见的三元运算符:
let var = if something { 1 } else { 2 };
循环会根据break的调用返回结果。你可以利用它,反复重试某个操作,直到成功。
变量
变量通过 let 声明,并且有作用域。类型是可选的,Rust 非常擅长推断类型(比 Typescript 更出色)。
let var: usize = 1;
上述变量定义了一个类型为usize的变量var(usize是一个32或64位的数字,具体取决于计算机架构)。
你可以重复声明变量。当重复声明某个变量时,之前声明的变量就会被删除(除非该变量被引用,在这种情况下只有引用会保留,而原始变量会被删除),而且变量的类型也会改变。
let var = 1;
let var = "something";
在默认情况下,变量是不可变的。如果你想修改它们,则需要在 let 之后加上关键字 mut。
let var = 1;
var = 2; // 错误!不可以修改不可变的变量
let mut var = 1;
var = 2;
函数
fn main(arg: u8) -> u8 {
// something
arg
}
函数的行为几乎与JS一模一样,只不过它们并不是数据类型,而且语法上略有不同。
参数的指定与 Typescript 类似,即key: type。返回类型通过 -> 指定。
有趣的是,虽然 Rust 需要分号,但如果最后一个表达式后面的分号忘写了,它会被作为返回值(即使没有 return 关键字)。
If语句
if something {
} else {
} else if something_else {
}
if 语句的使用非常基本,不在此赘述。
有一点需要注意,如非必要,使用括号实际上是错误的。你可以利用括号指定执行顺序:
if (something || something_else) && something_other {}
如前所述,if 也可以返回一个值,而该值可用于赋值、参数、返回或其他地方。
let var = if something { 1 } else { 2 };
这里的花括号是必需的。
类型
Rust的类型有两种:基本数据类型(数字、str),结构(String)。
二者之间唯一的区别是,基本类型的初始化可以直接赋值,而复杂类型则需要某种构造函数。
堆与栈
我之前几乎不需要考虑堆与栈的问题。(据我所知,JS中的对象都存储在堆中,只有基本类型在栈中。)
堆:
● 速度慢
● 比较大
栈
● 非常快
● 比较小
基本类型和基本的结构都存储在栈中。要在堆中存贮值,需要使用Box<T>。另外,Vec<T> 也可以将值保存到堆中。
如果你使用的内存较多,或者需要在结构中使用带有值的enum,则可能需要使用堆。
如果发生栈溢出,则说明你使用了过多的栈内存。对于一些较大的值,应该使用Box。
常见的基本类型
数字:
● i8、i16、i32、i64、i128:有符号整数,包括负数。数字表示值的比特数。
● u8、u16、u32、u64、u128:无符号整数,从零开始。它们的最大容量翻了一倍,因为有一个额外的比特可用(在有符号整数中用于表示符号)。数字表示值的比特数。
● f32 和 f64:浮点数。javascript 世界中常见的数字。
字符串:
● str:简单的UTF-8 字符串(所有 Rust 字符串都是 UTF-8。不能使用无效的 UTF-8 字符串,会引发异常或造成panic)。通常用作指针(即 &str)。
● String:一种更复杂的类型(严格来说不是基本类型),存储在堆中。
数组:
● T :具有固定长度的数组(如果使用 Option<T> 类型,则数组内包含的元素数量可以小于实际长度)。
元组
元组可用于存储不同类型的多个值(从本质上来说就是可以容纳不同类型且大小固定的数组)。
与数组不同,元组可通过点(.)直接访问,例如 tuple.0 表示获取第一项,而 tuples 没有.len 之类的方法。
let var = (1, "str");
有一个很有意思的小技巧,你可以通过(空元组)返回“void”。既没有 return 语句,也不会返回值的函数会返回。
常见结构
Option<T>
● 这是一个枚举,值为Some(T) 或 None。(我们稍后再讨论enum,Rust中的枚举与其他语言略有不同。)
● 如果想获取该值,你可以使用 match,就像使用其他枚举一样,或者使用 .unwrap (如果值为None,则会导致panic)。
Result<T, E>
● 这个结构与 Option 类似,但常用于处理错误(通常由 IO 方法返回)。
● 它的值是 Ok(T) 或 Err(E)。
● 如果想获取该值,你可以使用match 块或 unwrap。
● 为了方便使用,当函数返回 Result<T, E> 时,可以在返回值为 Result<T, E>(其中E必须为兼容的类型)的方法调用之后使用 ? 来返回错误E(类似于使用.unwrap(),但当函数出错时不会造成panic)。
fn example -> Result<, Error> { // 一种错误类型。为了简便起见,你可以使用String,或自定义enum。
something_that_returns_result?;
Ok() // returns empty Tuple
}
Vec<T>
● 向量是可增长的数组,存储在堆上。
● 向量支持 .push、.pop 等常用操作。详情参见Rust文档。
Box<T>
● 在堆上存储T。可用于在结构中使用enum,或者用于释放栈空间。
定义结构
结构类似于对象,但它们的大小是静态的。
结构可以通过如下几种方式定义。
● 使用Tuple作为声明(类似于元组的别名)
struct Something(u8, u16); // a struct with 2 numbers, one unsigned 8 bit, the other one unsigned 16 bit
● 使用对象表示法(类似于声明类或对象)
struct Something {
value: u8,
another_value: u16
}
● 使用struct作为别名
struct Something = u8; // a single value
这种方法的适用情况为:你试图创建一个enum,而其值可能是正在定义的结构,而该结构中又要(直接或间接)引用该enum。
struct MaybeRecursive {
possibly_self: Option<MaybeRecursive> // error!
}
struct MaybeRecursive {
possibly_self: Option<Box<MaybeRecursive>> // fine
}
我在为自己的shell创建抽象语法树时,就遇到了这个问题。
要创建结构的实例,需要使用下述写法(类似于C#中定义数组):
Something { variable: 1, another_variable: 1234}
定义enum
下面是示例:
enum EnumName {
First,
Second
}
可以为enum指定数值(例如序列化或反序列化数值的情况):
enum EnumName {
First = 1,
Second // auto incremented
}
更强大的写法如下:
enum EnumName {
WithValue(u8),
WithMultipleValues(u8, u64, SomeStruct),
CanBeSelf(EnumName),
Empty
}
你可以用match提取出值。
Match
match是Rust最强大的功能之一。
Match是更强大的switch语句。使用方法与普通的swtich语句一样,除了一点:它必须覆盖所有可能的情况。
let var = 1;
match var {
1 => println!("it's 1"),
2 => println!("it's 2"),
// following required if the list is not exhaustive
_ => println!("it's not 1 or 2")
}
也可以match范围:
match var {
1..=2 => println("it's between 1 and 2 (both inclusive)"),
_ => println!("it's something else")
}
也可以什么都不做:
match var {
_ => {}
}
可以使用match安全地unwrap Result<T, E>和Option<T>,以及从其他enum中获取值:
let option: Option<u8> = Some(1);
match option {
Some(i) => println!("It contains {i}"),
None => println!("it's empty :c")
// notice we don't need _ here, as Some and None are the only possible values of option, thus making this list exhaustive
}
如果你不使用i(或其他值),Rust会发出警告。你可以使用_来代替。
match option {
Some(_) => println!("yes"),
None => println!("no")
}
match也是表达式:
let option: Option<u8> = Some(1);
let surely = match option {
Some(i) => i,
None => 0
}
println!("{surely}");
你可以看看Option的文档(或通过IDE的自动补齐,看看都有哪些可以使用的trait或方法)。
你也许注意到了,你可以使用.unwrap_or(val)来代替上述代码(上述match等价于.unwrap_or(0))。
Loop
loop循环是最简单的循环。只需要使用loop即可。
loop {
if something { break }
}
该代码会一直运行,直到遇到break(或return,return也会同时返回父函数)。
for
for循环是最简单易用的循环。它比传统的for循环更容易使用。
for i in 1..3 {} // for(let i = 1; i < 3; i ) // i is not a thing, see things to note
for i in 1..=3 {} // for(let i = 1; i <= 3; i )
for i in 1..=var {} // for(let i = 1; i <= var; i )
for i in array_or_vec {} // for(let i of array_or_vec) in JS
// again, as most other things, uses a trait, here named "iterator"
// for some types, you need to call `.iter` or `.into_iter`.
// Rust Compiler will usually tell you this.
for i in something.iter {}
while
很简单的循环。与其他语言不同,Rust没有do...while,只有最基础的while。
while condition {
looped;
}
语法与if一样,只不过内容会循环执行。
打印输出
打印输出可以使用 print! 和 println!。
!表示这是一个宏(即可以扩展成其他代码的快捷方式),但你不需要过多考虑。另一个常用的宏是 vec! ,它能利用数组创建 Vec<T> (使用 [] 内的值)。
这些宏都有一个简单的模板系统。
● 输出一行使用 println!。
● 输出一个静态字符串使用 print!("something")。println!中ln的意思是行,也就是说它会添加换行符号(\n)。console.log会默认添加换行。
● 要输出一个实现了Display trait的值(绝大多数基本类型都实现了),可以使用 print!("{variable}")。
● 要输出一个实现了Debug trait的值(可以从Display继承),使用 print!("{variable:?}")。
● 要输出更复杂的实现了Display trait的内容,使用 print!("{}", variable)。
● 要输出更复杂的实现了Debug trait的内容,使用 print!("{:?}", variable)。
Trait
Trait是Rust中最难理解的概念之一,也是最强大的概念之一。
Rust没有采用基于继承的系统(面向对象的继承,或JavaScript基于原型的继承),而是采用了鸭子类型(即,如果一个东西像鸭子一样叫,那么它就是鸭子)。
每个类型都有且只有一个“默认”(或匿名)trait,只能在与该类型同一个模块中实现。通常都是该类型独有的方法。
其他的都叫trait。例如:
trait Duck {
fn quack(&self) -> String;
/// returns if the duck can jump
fn can_jump(&self) -> bool { // default trait implementation. Code cannot have any assumptions about the type of self.
false // by default duck cannot jump
}
}
struct Dog; // a struct with empty tuple
impl Dog { // a nameless default trait.
fn bark(&self) -> String { String::from("bark!") }
}
impl Duck for Dog { // implement Duck trait for Dog type (struct)
fn quack(&self) -> String { String::from("quark!") } // dog kind of quacks differently
}
let dog = Dog {};
dog.bark;
dog.quack;
首先,我们定义了trait(在面向对象语言中叫做接口,但它只包含方法或函数)。然后为给定的类型(上例中为Dog)实现trait。
一些trait可以自动实现。常见的例子就是Display和Debug trait。这些trait要求,结构中使用的类型必须要相应地实现Display或Debug。
#[derive(Display,Debug)]
struct Something {
var: u8
}
println!("{:?}", Something { var: 1 });
作用域
Trait有作用域,而且与它实现的类型的作用域是独立的。也就是说,你可以使用一个类型,但无法使用一个trait的实现(例如,如果这个实现来自另外一个库,而不是来自该类型本身)。你可以use这个实现。
self
trait中的self指向它实现的类型。&self是指向 self: &Self 的别名,其中Self表示该类型(上例中的 self: &Dog)。self也是self: Self的别名,但两者的区别就是后者会移动变量(即消耗该变量,该变量就无法从外部访问了)。
当函数定义不以self、&self或&mut self开始时(&mut self相当于带有可改变引用的 &self),就是一个静态方法。Trait依然可以像任何方法一样定义并实现静态方法。常见的一个静态方法是new,用于创建类型或结构的实例:
impl Something {
fn new -> Something {
Something { x: 1 }
}
}
...
let var = Something::new;
指针
指针实际上非常易懂,尽管它来自其他更高级的语言。我经常会用错。
&A指向A,使用时只需要确保A存在,即可保证&A存在,因为我们不应该让指针指向不存在的对象。
Rust会在编译时进行静态检查,确保不会出现上述情况。它会自动释放超出作用域的变量,并且不允许指针的存活超过变量。另一个安全保证是,只能有一个可改变的指针。
也就是说下述代码是错误的:
let a = 1;
let b = &a;
let c = &mut a;
println!("{b}"); // Error! there can only be one mutable pointer
c = 1;
我们只需要保证原始变量在指针的作用域中一直存在即可。
在结构中使用指针会有点问题,因为编译器不喜欢这种做法(因为结构的寿命通常比原始变量更长)。我通常会采用所有权转移或克隆(.clone(),Clone trait的一部分,可以被derived)。
有时候,一些函数要求只能用指针,不能用所有权转移。这时,只需在值的前面加上 & (或 &mut)即可。
something(&a);
此外,还有双重、三重等指针,但很少见,而且一般来说只会更难处理。
你也不需要考虑释放变量的问题,Rust会在超出作用域时自动释放。
命名空间
使用全名就无需导入。导入只不过是别名。
std::env::args
use std::env;
env::args
use std::env::args;
args
选择多个“命名空间”可以使用{},如:
use std::env::{args, var};
也可以重复使用use:
use std::env;
use std::env::args;
env::var;
args
还有一点,你也可以在函数内使用use。这样,如果代码没有被执行,库就不会被导入(即,如果函数没有在代码路径中出现,例如,use了一个测试用的库,而use只写在了测试用例中,那么在正常构建时就不会导入该库)。
fn test {
use std::env;
env::var;
}
但我不推荐在正常的代码路径中这样写,应该使用全局的导入。
可见性
讨论完命名空间之后,我们来讨论一下可见性。
本质上,默认情况下任何东西都是私有的,只能被它所在的文件访问。
● trait及其方法
● 结构及其成员
● enum(成员继承enum的可见性,这是合理的,参见Match)
● 函数
● trait的实现依赖于trait和实现该trait的结构,即,只有两者都是公有的,该实现才是公有的。
要设置为公有(即可以从外部访问),需要使用关键字pub:
pub struct Something {
pub letter: char
}
pub trait CustomTrait { ... }
pub fn method {}
使用多个文件
有时候我会想念 require("./fire")。
要想“导入”一个文件,要使用 mod指令。通过cargo下载的crate会自动导入。
main.rs
mod my;
fn main {
my::function;
// or
use my::function;
function;
}
my.rs
pub fn function {
println!("function");
}
你也可以使用pub mob重新导出一个文件。绝大多数已有的Rust代码都会对支持文件夹采用下列操作:
main.rs
mod my;
use my::file;
fn main {
file::function;
}
my/mod.rs - mod.rs这个名字是特殊的,类似于index.js
pub mod file;
my/file.rs
pub fn function {
println!("function");
}
关于println!,参见“打印输出”。
编写文档
编写文档只需使用三个斜线 ///。一些IDE会采用不同的高亮方式显示。
类似于JSDoc,只不过其类型不会显式标注,因为代码中已经写了类型。
/// a description of var
let var = "something";
原文地址:https://danbulant.eu/posts/rust-basics
END
《新程序员001-004》全面上市,对话世界级大师,报道中国IT行业创新创造
成就一亿技术人
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com