跳到主要内容

迭代器与生成器

迭代的英文“iteration”源自拉丁文 itero,意思是“重复”或“再来”。在软件开发领域,“迭代”的意思是按照顺序反复多次执行一段程序,通常会有明确的终止条件。ECMAScript 6 规范新增了两个高级特性:迭代器生成器。使用这两个特性,能够更清晰、高效、方便地实现迭代。

理解迭代

在 JavaScript 中,计数循环就是一种最简单的迭代:

for (let i = 1; i <= 10; ++i) {
console.log(i);
}

迭代即在一个有序集合上进行依次的遍历,有明确定义开始和结束。数组是 JavaScript 中有序集合的最典型例子。

let collection = ['foo', 'bar', 'baz'];

for (let index = 0; index < collection.length; ++index) {
console.log(collection[index]);
}
// foo
// bar
// baz

因为数组有已知的长度,且数组每一项都可以通过索引获取,所以整个数组可以通过递增索引来遍历。由于如下原因,通过这种循环来执行例程并不理想。

1.迭代之前需要事先知道如何使用数据结构。

数组中的每一项都只能先通过引用取得数组对象,然后再通过 [] 操作符取得特定索引位置上的项。这种情况并不适用于所有数据结构。

2.遍历顺序并不是数据结构固有的。

通过递增索引来访问数据是特定于数组类型的方式,并不适用于其他具有隐式顺序的数据结构。

ES5 新增了 Array.prototype.forEach() 方法,向通用迭代需求迈进了一步(但仍然不够理想):

let collection = ['foo', 'bar', 'baz'];

collection.forEach(item => console.log(item));
// foo
// bar
// baz

这个方法解决了单独记录索引和通过数组对象取得值的问题。不过,没有办法标识迭代何时终止。因此这个方法只适用于数组,而且回调结构也比较笨拙。

在 ECMAScript 较早的版本中,执行迭代必须使用循环或其他辅助结构。随着代码量增加,代码会变得越发混乱。很多语言都通过原生语言结构解决了这个问题,开发者无须事先知道如何迭代就能实现迭代操作。这个解决方案就是迭代器模式。Python、Java、C++,还有其他很多语言都对这个模式提供了完备的支持。JavaScript 在 ECMAScript 6 以后也支持了迭代器模式。

迭代器模式

迭代器模式(特别是在 ECMAScript 这个语境下)描述了一个方案,即可以把有些结构称为“可迭代对象”(iterable),因为它们实现了正式的 Iterable 接口,而且可以通过迭代器 Iterator 消费。

可迭代对象是一种抽象的说法。基本上,可以把可迭代对象理解成数组或集合这样的集合类型的对象。它们包含的元素都是有限的,而且都具有无歧义的遍历顺序:

// 数组的元素是有限的
// 递增索引可以按序访问每个元素
let arr = [3, 1, 4];

// 集合的元素是有限的
// 可以按插入顺序访问每个元素
let set = new Set().add(3).add(1).add(4);

可迭代对象不一定是集合对象。在 JavaScript 中,可迭代对象是指实现了迭代器协议(Iterator Protocol)的对象。

任何实现 Iterable 接口的数据结构都可以被实现 Iterator 接口的结构“消费”(consume)。迭代器(iterator)是按需创建的一次性对象。每个迭代器都会关联一个可迭代对象,而迭代器会暴露迭代其关联可迭代对象的 API。迭代器无须了解与其关联的可迭代对象的结构,只需要知道如何取得连续的值。这种概念上的分离正是 Iterable 和 Iterator 的强大之处。

可迭代协议

实现 Iterable 接口(可迭代协议)要求同时具备两种能力:支持迭代的自我识别能力创建实现Iterator 接口的对象的能力。在 ECMAScript 中,这意味着必须暴露一个属性作为“默认迭代器”,而且这个属性必须使用特殊的 Symbol.iterator 作为键。这个默认迭代器属性必须引用一个迭代器工厂函数,调用这个工厂函数必须返回一个新迭代器。

实现 Iterable 接口
let iterableObj = {
data: ['JavaScript', 'Java', 'Python', 'Rust'],

// 支持迭代的自我识别能力: 使用 Symbol.iterator 作为默认迭代器键
[Symbol.iterator]() {
let index = 0;
let data = this.data;

// 创建实现Iterator 接口的对象的能力: 迭代器工厂函数,返回新的迭代器对象
return {
// 实现了迭代器协议
next() {
if (index < data.length) {
return { done: false, value: data[index++] };
} else {
return { done: true };
}
},
};
},
};
for (let item of iterableObj) {
console.log(item);
}
// JavaScript
// Java
// Python
// Rust

很多内置类型都实现了 Iterable 接口:

  • 字符串
  • 数组
  • 映射
  • 集合
  • arguments 对象
  • NodeList 等 DOM 集合类型

检查是否存在默认迭代器属性可以暴露这个工厂函数:

let str = 'Hello World!';
let obj = {};

console.log(str[Symbol.iterator]); // [Function: [Symbol.iterator]]
console.log(obj[Symbol.iterator]); // undefined

// 调用这个工厂函数会生成一个迭代器
let iterator = str[Symbol.iterator]();
console.log(iterator); // Object [String Iterator] {}

实际写代码过程中,不需要显式调用这个工厂函数来生成迭代器。实现可迭代协议的所有类型都会 自动兼容接收可迭代对象的任何语言特性。接收可迭代对象的原生语言特性包括:

  • for-of 循环
  • 数组解构
  • 扩展操作符
  • Array.from()
  • 创建集合
  • 创建映射
  • Promise.all() 接收由期约组成的可迭代对象
  • Promise.race() 接收由期约组成的可迭代对象
  • yield* 操作符,在生成器中使用

这些原生语言结构会在后台调用提供的可迭代对象的这个工厂函数,从而创建一个迭代器:

iterableObj 实现了 Iterable 接口和 Iterator 迭代器
// for-of 循环
for (let item of iterableObj) {
console.log(item);
}
// JavaScript
// Java
// Python
// Rust

// 数组解构
let [a, b, c, d] = iterableObj;
console.log(a, b, c, d); // JavaScript Java Python Rust

// 扩展操作符
console.log([...iterableObj]); // [ 'JavaScript', 'Java', 'Python', 'Rust' ]

// Array.from()
console.log(Array.from(iterableObj)); // [ 'JavaScript', 'Java', 'Python', 'Rust' ]

// Set 构造函数
let set = new Set(iterableObj);
console.log(set); // Set(4) { 'JavaScript', 'Java', 'Python', 'Rust' }

// Map 构造函数
let pairs = Array.from(iterableObj).map((value, index) => [index, value]);
let map = new Map(pairs);
console.log(map); // Map(4) { 0 => 'JavaScript', 1 => 'Java', 2 => 'Python', 3 => 'Rust' }

如果对象原型链上的父类实现了 Iterable 接口,那这个对象也就实现了这个接口:

class BookArray extends Array {}
let books = new BookArray('JavaScript', 'Java');

for (let book of books) {
console.log(book);
}
// JavaScript
// Java

迭代器协议

迭代器是一种一次性使用的对象,用于迭代与其关联的可迭代对象。迭代器 API 使用 next()方法在可迭代对象中遍历数据。每次成功调用 next(),都会返回一个 IteratorResult 对象,其中包含迭代器返回的下一个值。若不调用 next(),则无法知道迭代器的当前位置。

next() 方法返回的迭代器对象 IteratorResult 包含两个属性:done 和 value。done 是一个布尔值,表示是否还可以再次调用 next() 取得下一个值;value 包含可迭代对象的下一个值(done 为false),或者 undefined(done 为 true)。done: true 状态称为“耗尽”。可以通过以下简单的数组来演示:

迭代器的实现
[Symbol.iterator] = function () {
return {
next() {
return { done: true, value: undefined };
},
};
};
// 可迭代对象
let arr = ['foo', 'bar'];

// 迭代器工厂函数
console.log(arr[Symbol.iterator]); // f values() { [native code] }

// 迭代器
let iterator = arr[Symbol.iterator]();
console.log(iterator); // ArrayIterator {}

// 执行迭代
console.log(iterator.next()); // { done: false, value: 'foo' }
console.log(iterator.next()); // { done: false, value: 'bar' }
console.log(iterator.next()); // { done: true, value: undefined }

这里通过创建迭代器并调用 next() 方法按顺序迭代了数组,直至不再产生新值。迭代器并不知道怎么从可迭代对象中取得下一个值,也不知道可迭代对象有多大。只要迭代器到达 done: true 状态,后续调用 next() 就一直返回同样的值了:

let arr = ['foo'];
let iter = arr[Symbol.iterator]();
console.log(iter.next()); // { done: false, value: 'foo' }
console.log(iter.next()); // { done: true, value: undefined }
console.log(iter.next()); // { done: true, value: undefined }
console.log(iter.next()); // { done: true, value: undefined }

每个迭代器都表示对可迭代对象的一次性有序遍历。不同迭代器的实例相互之间没有联系,只会独 立地遍历可迭代对象:

let arr = ['foo', 'bar'];
let iter1 = arr[Symbol.iterator]();
let iter2 = arr[Symbol.iterator]();

console.log(iter1.next()); // { done: false, value: 'foo' }
console.log(iter2.next()); // { done: false, value: 'foo' }

console.log(iter2.next()); // { done: false, value: 'bar' }
console.log(iter1.next()); // { done: false, value: 'bar' }

迭代器并不与可迭代对象某个时刻的快照绑定,而仅仅是使用游标来记录遍历可迭代对象的历程。如果可迭代对象在迭代期间被修改了,那么迭代器也会反映相应的变化:

let arr = ['foo', 'baz'];
let iter = arr[Symbol.iterator]();

console.log(iter.next()); // { done: false, value: 'foo' }

// 在数组中间插入值
arr.splice(1, 0, 'bar');
console.log(iter.next()); // { done: false, value: 'bar' }
console.log(iter.next()); // { done: false, value: 'baz' }
console.log(iter.next()); // { done: true, value: undefined }
注意

迭代器维护着一个指向可迭代对象的引用,因此迭代器会阻止垃圾回收程序回收可迭代对象。

“迭代器”的概念有时候容易模糊,因为它可以指通用的迭代,也可以指接口,还可以指正式的迭代器类型。下面的例子比较了一个显式的迭代器实现和一个原生的迭代器实现。

显式的迭代器实现
// 一个实现迭代器接口(Iterator)的迭代器对象
class IteratorObject {
[Symbol.iterator]() {
return {
next() {
return { done: false, value: 'foo' };
},
};
}
}
let iter = new IteratorObject();
console.log(iter[Symbol.iterator]()); // { next: [Function: next] }
原生的迭代器实现
// Array 类型实现了可迭代接口(Iterable)
// 调用 Array 类型的默认迭代器工厂函数
// 会创建一个 ArrayIterator 的实例
let arr = new Array();

// 打印出 ArrayIterator 的实例
console.log(arr[Symbol.iterator]()); // Array Iterator {}

自定义迭代器

与 Iterable 接口类似,任何实现 Iterator 接口的对象都可以作为迭代器使用。下面这个例子中的 Counter 类只能被迭代一定的次数:

class Counter {
// Counter 的实例应该迭代 limit 次
constructor(limit) {
this.count = 1;
this.limit = limit;
}
next() {
if (this.count <= this.limit) {
return { done: false, value: this.count++ };
} else {
return { done: true, value: undefined };
}
}
[Symbol.iterator]() {
return this;
}
}

let counter = new Counter(3);

for (let i of counter) {
console.log(i);
}
// 1
// 2
// 3

这个类实现了 Iterator 接口,但不理想。这是因为它的每个实例只能被迭代一次:

for (let i of counter) {
console.log(i);
}
// 1
// 2
// 3
for (let i of counter) {
console.log(i);
}
// (nothing logged)

为了让一个可迭代对象能够创建多个迭代器,必须每创建一个迭代器就对应一个新计数器。为此,可以把计数器变量放到闭包里,然后通过闭包返回迭代器:

升级 Counter 可迭代对象
class Counter {
constructor(limit) {
this.limit = limit;
}
[Symbol.iterator]() {
let count = 1,
limit = this.limit;
return {
next() {
if (count <= limit) {
return { done: false, value: count++ };
} else {
return { done: true, value: undefined };
}
},
};
}
}

let counter = new Counter(3);

for (let i of counter) {
console.log(i);
}
// 1
// 2
// 3

for (let i of counter) {
console.log(i);
}
// 1
// 2
// 3

迭代器对象的 Symbol.iterator 属性指向迭代器对象本身,迭代器对象自身也是一个可迭代对象。因此,可以通过多次访问 Symbol.iterator 属性来获取迭代器。

let arr = ['foo', 'bar', 'baz'];
let iter1 = arr[Symbol.iterator]();
let iter2 = iter1[Symbol.iterator]();

console.log(iter1 === iter2); // true
console.log(iter1); // Object [Array Iterator] {}

提前终止迭代器

可选的 return() 方法用于指定在迭代器提前关闭时执行的逻辑。执行迭代的结构在想让迭代器知道它不想遍历到可迭代对象耗尽时,就可以“关闭”迭代器。可能的情况包括:

  • for-of 循环通过 break、continue、return 或 throw 提前退出;
  • 解构操作并未消费所有值。

return() 方法必须返回一个有效的 IteratorResult 对象。简单情况下,可以只返回 { done: true }。 因为这个返回值只会用在生成器的上下文中。

return() 的语法
class IteratorObject {
[Symbol.iterator]() {
return {
next() {
return { done: true, value: 'undefined' };
},
return() {
console.log('提前终止执行');
return { done: true };
},
};
}
}

如下面的代码所示,内置语言结构在发现还有更多值可以迭代,但不会消费这些值时,会自动调用 return() 方法。

class Counter {
constructor(limit) {
this.limit = limit;
}
[Symbol.iterator]() {
let count = 1,
limit = this.limit;
return {
next() {
if (count <= limit) {
return { done: false, value: count++ };
} else {
return { done: true };
}
},
return() {
console.log('提前退出');
return { done: true };
},
};
}
}

let counter1 = new Counter(5);

for (let i of counter1) {
if (i > 2) {
break;
}
console.log(i);
}
// 1
// 2
// 提前退出

let counter2 = new Counter(5);
try {
for (let i of counter2) {
if (i > 2) {
throw 'err';
}
console.log(i);
}
} catch (e) {}
// 1
// 2
// 提前退出

let counter3 = new Counter(5);

// 解构操作并未消费所有值。
let [a, b] = counter3;
// 提前退出

如果迭代器没有关闭,则还可以继续从上次离开的地方继续迭代。比如,数组的迭代器就是不能关闭的:

let a = [1, 2, 3, 4, 5];
let iter = a[Symbol.iterator]();
for (let i of iter) {
console.log(i);
if (i > 2) {
break;
}
}
// 1
// 2
// 3

for (let i of iter) {
console.log(i);
}
// 4
// 5

因为 return() 方法是可选的,所以并非所有迭代器都是可关闭的。要知道某个迭代器是否可关闭,可以测试这个迭代器实例的 return 属性是不是函数对象。不过,仅仅给一个不可关闭的迭代器增加这个方法并不能让它变成可关闭的。这是因为调用 return() 不会强制迭代器进入关闭状态。即便如此,return() 方法还是会被调用。

查询迭代器是否可关闭
// IteratorObject 实现了可以关闭的迭代器
class IteratorObject {
[Symbol.iterator]() {
return this;
}
next() {
return { done: true, value: 'undefined' };
}
return() {
return { done: true };
}
}

let iter = new IteratorObject()[Symbol.iterator]();
console.log(typeof iter.return === 'function'); // true

一个不可关闭的迭代器添加 return() 方法并不会将其变为可关闭的。当调用不可关闭的迭代器的 return() 方法时,虽然方法会被调用,但迭代器并不会强制进入关闭状态。

调用 return() 不会强制迭代器进入关闭状态
let a = [1, 2, 3, 4, 5];
let iter = a[Symbol.iterator]();

iter.return = function () {
console.log('提前退出');
return { done: true };
};

for (let i of iter) {
console.log(i);
if (i > 2) {
break;
}
}
// 1
// 2
// 3
// 提前退出

for (let i of iter) {
console.log(i);
}
// 4
// 5

在 ECMAScript 标准的设计中,迭代器的 return() 方法是可选的,并且没有在规范中定义迭代器必须强制关闭的行为。迭代器的设计思想是提供一种逐个产生值的机制,但并不要求一定要有提前终止的能力。

因此,尽管调用不可关闭迭代器的 return() 方法会执行方法体内的代码,但迭代器本身并没有规定在调用 return() 方法后必须立即停止迭代并进入关闭状态。

实际上,只有实现了 return() 方法的迭代器才具备可关闭的功能,可以通过该方法来提前终止迭代并进行一些清理操作。无法通过额外增加一个 return() 方法来使本来不可关闭的迭代器变为可关闭,因为该方法并没有被规范要求。

所以,在使用迭代器时,如果需要可关闭的行为,则需要确保使用实现了 return() 方法的可迭代对象的迭代器。

生成器

生成器是 ECMAScript 6 新增的一个极为灵活的结构,拥有在一个函数块内暂停和恢复代码执行的能力。这种新能力具有深远的影响,比如,使用生成器可以自定义迭代器和实现协程。

生成器基础

生成器的形式是一个函数,函数名称前面加一个星号(*)表示它是一个生成器。只要是可以定义 函数的地方,就可以定义生成器。

生成器语法
// 生成器函数声明
function* generatorFn() {}

// 生成器函数表达式
let generatorFn = function* () {};

// 作为对象字面量方法的生成器函数
let foo = {
*generatorFn() {},
};

// 作为类实例方法的生成器函数
class Foo {
*generatorFn() {}
}

// 作为类静态方法的生成器函数
class Bar {
static *generatorFn() {}
}

// 标识生成器函数的星号不受两侧空格的影响
注意

箭头函数不能用来定义生成器函数。

调用生成器函数会产生一个生成器对象。生成器对象一开始处于暂停执行(suspended)的状态。与迭代器相似,生成器对象也实现了 Iterator 接口,因此具有 next() 方法。调用这个方法会让生成器开始或恢复执行。

function* generatorFn() {}
const g = generatorFn();

console.log(g); // generatorFn {<suspended>}
console.log(g.next); // f next() { [native code] }

生成器的 next() 方法返回的是一个迭代结果对象(IteratorResult对象)。这个对象包含两个属性:valuedone,函数体为空的生成器函数中间不会停留,调用一次 next() 就会让生成器到达 {done: true} 状态。

function* generatorFn() {}

let generatorObject = generatorFn();

console.log(generatorObject); // generatorFn {<suspended>}
console.log(generatorObject.next()); // { done: true, value: undefined }

其中 value 属性是生成器函数的返回值,默认值为 undefined,可以通过生成器函数的返回值指定:

function* generatorFn() {
return 'foo';
}

let generatorObject = generatorFn();

console.log(generatorObject); // generatorFn {<suspended>}
console.log(generatorObject.next()); // { done: true, value: 'foo' }

生成器函数只会在初次调用 next()方法后开始执行,如下所示:

function* generatorFn() {
console.log('foobar');
}
// 初次调用生成器函数并不会打印日志

let generatorObject = generatorFn();
generatorObject.next(); // foobar

生成器对象实现了 Iterable 接口,它们默认的迭代器是自引用的:

function* generatorFn() {}

const g = generatorFn();
console.log(g === g[Symbol.iterator]()); // true

通过 yield 中断执行

yield 关键字可以让生成器停止和开始执行,也是生成器最有用的地方。生成器函数在遇到 yield 关键字之前会正常执行。遇到这个关键字后,执行会停止,函数作用域的状态会被保留。停止执行的生成器函数只能通过在生成器对象上调用 next() 方法来恢复执行:

function* generatorFn() {
yield;
}

let generatorObject = generatorFn();

console.log(generatorObject.next()); // { done: false, value: undefined }
console.log(generatorObject.next()); // { done: true, value: undefined }

此时的yield 关键字有点像函数的中间返回语句,它生成的值会出现在 next() 方法返回的对象里。通过 yield 关键字退出的生成器函数会处在 done: false 状态;通过 return 关键字退出的生成器函数会处于 done: true 状态。

function* generatorFn() {
yield '1';
yield '2';
return '3';
}

let generatorObject = generatorFn();

console.log(generatorObject.next()); // { done: false, value: '1' }
console.log(generatorObject.next()); // { done: false, value: '2' }
console.log(generatorObject.next()); // { done: true, value: '3' }

不同生成器实例之间的状态是相互独立的,因此一个生成器函数的执行不会影响另一个生成器函数的状态。

function* generatorFn() {
yield '1';
yield '2';
return '3';
}

let generatorObject1 = generatorFn();
let generatorObject2 = generatorFn();

// 根据打印结果可知。generatorObject1、generatorObject2都是第一次执行生成器函数
console.log(generatorObject1.next()); // { done: false, value: '1' }
console.log(generatorObject2.next()); // { done: false, value: '1' }

yield 关键字只能在生成器函数内部使用,用在其他地方会抛出错误。类似函数的 return 关键字,yield 关键字必须直接位于生成器函数定义中,出现在嵌套的非生成器函数中会抛出语法错误:

function* validGeneratorFn() {
yield;
}

// 无效
function* invalidGeneratorFnA() {
function a() {
yield;
}
}
// 无效
function* invalidGeneratorFnB() {
const b = () => {
yield;
};
}

生成器对象作为可迭代对象

在生成器对象上显式调用 next()方法的用处并不大。其实,如果把生成器对象当成可迭代对象, 那么使用起来会更方便:

function* generatorFn() {
yield 1;
yield 2;
yield 3;
}
for (const x of generatorFn()) {
console.log(x);
}
// 1
// 2
// 3

使用 yield 实现输入和输出

除了可以作为函数的中间返回语句使用,yield 关键字还可以作为函数的中间参数使用。上一次让生成器函数暂停的 yield 关键字会接收到传给 next() 方法的第一个值。这里有个地方不太好理解——第一次调用 next() 传入的值不会被使用,因为这一次调用是为了开始执行生成器函数:

function* generatorFn() {
console.log(yield);
console.log(yield);
console.log(yield);
}

let generatorObject = generatorFn();

generatorObject.next('one');
generatorObject.next('two');
generatorObject.next('three');
// 输出结果:
// two
// three

yield 关键字可以同时用于输入和输出, 通过 next() 方法时,可以通过传递参数向生成器输入值。

function* generatorFn() {
return yield 'foo';
}

let generatorObject = generatorFn();

console.log(generatorObject.next()); // { done: false, value: 'foo' }
console.log(generatorObject.next('bar')); // { done: true, value: 'bar' }

因为函数必须对整个表达式求值才能确定要返回的值,所以它在遇到 yield 关键字时暂停执行并计算出要产生的值:"foo"。下一次调用 next() 传入了"bar",作为交给同一个 yield 的值。然后这个值被确定为本次生成器函数要返回的值。

yield 关键字并非只能使用一次。

循环使用同一个yield关键字
function* generatorFn() {
for (let i = 0; ; ++i) {
yield i;
}
}

let generatorObject = generatorFn();

console.log(generatorObject.next()); // 0
console.log(generatorObject.next()); // 1
console.log(generatorObject.next()); // 2

产生可迭代对象

可以使用星号增强 yield 的行为,让它能够迭代一个可迭代对象,从而一次产出一个值:

// 等价的 generatorFn:
// function* generatorFn() {
// for (const x of [1, 2, 3]) {
// yield x;
// }
// }

function* generatorFn() {
yield* [1, 2, 3];
}

yield* 的值是关联迭代器返回 done: true 时的 value 属性。对于普通迭代器来说,这个值是 undefined:

function* generatorFn() {
console.log('iter value:', yield* [1, 2, 3]);
}
for (const x of generatorFn()) {
console.log('value:', x);
}
// value: 1
// value: 2
// value: 3
// iter value: undefined

对于生成器函数产生的迭代器来说,这个值就是生成器函数返回的值:

function* innerGeneratorFn() {
yield 'foo';
return 'bar';
}
function* outerGeneratorFn(genObj) {
console.log('iter value:', yield* innerGeneratorFn());
}
for (const x of outerGeneratorFn()) {
console.log('value:', x);
}
// value: foo
// iter value: bar

使用 yield* 实现递归算法

yield* 最有用的地方是实现递归操作,此时生成器可以产生自身。看下面的例子:

function* nTimes(n) {
if (n > 0) {
yield* nTimes(n - 1);
yield n - 1;
}
}

for (const x of nTimes(3)) {
console.log(x);
}
// 0
// 1
// 2

使用递归生成器结构和 yield* 可以优雅地表达递归算法。下面是一个图的实现,用于生成一个随机的双向图:

class Node {
constructor(id) {
this.id = id;
this.neighbors = new Set();
}
connect(node) {
if (node !== this) {
this.neighbors.add(node);
node.neighbors.add(this);
}
}
}
class RandomGraph {
constructor(size) {
this.nodes = new Set();
// 创建节点
for (let i = 0; i < size; ++i) {
this.nodes.add(new Node(i));
}
// 随机连接节点
const threshold = 1 / size;
for (const x of this.nodes) {
for (const y of this.nodes) {
if (Math.random() < threshold) {
x.connect(y);
}
}
}
}
// 这个方法仅用于调试
print() {
for (const node of this.nodes) {
const ids = [...node.neighbors].map(n => n.id).join(',');
console.log(`${node.id}: ${ids}`);
}
}
}
const g = new RandomGraph(6);
g.print();
// 示例输出:
// 0: 2,3,5
// 1: 2,3,4,5
// 2: 1,3
// 3: 0,1,2,4
// 4: 2,3
// 5: 0,4

图数据结构非常适合递归遍历,而递归生成器恰好非常合用。为此,生成器函数必须接收一个可迭代对象,产出该对象中的每一个值,并且对每个值进行递归。这个实现可以用来测试某个图是否连通,即是否没有不可到达的节点。只要从一个节点开始,然后尽力访问每个节点就可以了。结果就得到了一个非常简洁的深度优先遍历:

class Node {
constructor(id) {
// ...
}
connect(node) {
// ...
}
}
class RandomGraph {
constructor(size) {
// ...
}
print() {
// ...
}
isConnected() {
const visitedNodes = new Set();
function* traverse(nodes) {
for (const node of nodes) {
if (!visitedNodes.has(node)) {
yield node;
yield* traverse(node.neighbors);
}
}
}
// 取得集合中的第一个节点
const firstNode = this.nodes[Symbol.iterator]().next().value;
// 使用递归生成器迭代每个节点
for (const node of traverse([firstNode])) {
visitedNodes.add(node);
}
return visitedNodes.size === this.nodes.size;
}
}

生成器作为默认迭代器

因为生成器对象实现了 Iterable 接口,而且生成器函数和默认迭代器被调用之后都产生迭代器,所以生成器格外适合作为默认迭代器。下面是一个简单的例子,这个类的默认迭代器可以用一行代码产出类的内容:

class Foo {
constructor() {
this.values = [1, 2, 3];
}
*[Symbol.iterator]() {
yield* this.values;
}
}

const f = new Foo();
for (const x of f) {
console.log(x);
}
// 1
// 2
// 3

这里,for-of 循环调用了默认迭代器(它恰好又是一个生成器函数)并产生了一个生成器对象。这个生成器对象是可迭代的,所以完全可以在迭代中使用。

提前终止生成器

与迭代器类似,生成器也支持“可关闭”的概念。一个实现 Iterator 接口的对象一定有 next()方法,还有一个可选的 return() 方法用于提前终止迭代器。生成器对象除了有这两个方法,还有第三个方法:throw()

function* generatorFn() {}
const g = generatorFn();

console.log(g); // generatorFn {<suspended>}
console.log(g.next); // f next() { [native code] }
console.log(g.return); // f return() { [native code] }
console.log(g.throw); // f throw() { [native code] }

return()

return() 方法会强制生成器进入关闭状态。提供给 return() 方法的值,就是终止迭代器对象的值:

function* generatorFn() {
for (const x of [1, 2, 3]) {
yield x;
}
}

const g = generatorFn();

console.log(g); // generatorFn {<suspended>}
console.log(g.return(4)); // { done: true, value: 4 }
console.log(g); // generatorFn {<closed>}

与迭代器不同,所有生成器对象都有 return()方法,只要通过它进入关闭状态,就无法恢复了。后续调用 next() 会显示 done: true 状态,而提供的任何返回值都不会被存储或传播:

function* generatorFn() {
for (const x of [1, 2, 3]) {
yield x;
}
}

const g = generatorFn();

console.log(g.next()); // { done: false, value: 1 }
console.log(g.return(4)); // { done: true, value: 4 }
console.log(g.next()); // { done: true, value: undefined }
console.log(g.next()); // { done: true, value: undefined }
console.log(g.next()); // { done: true, value: undefined }

for-of 循环等内置语言结构会忽略状态为 done: true 的 IteratorObject 内部返回的值。

function* generatorFn() {
for (const x of [1, 2, 3]) {
yield x;
}
}

const g = generatorFn();

for (const x of g) {
console.log(x);
if (x > 1) {
g.return(4);
}
}
// 1
// 2

throw()

throw() 方法会在暂停的时候将一个提供的错误注入到生成器对象中。如果错误未被处理,生成器就会关闭:

function* generatorFn() {
for (const x of [1, 2, 3]) {
yield x;
}
}

const g = generatorFn();

console.log(g); // generatorFn {<suspended>}

try {
g.throw('foo');
} catch (e) {
console.log(e); // foo
}
console.log(g); // generatorFn {<closed>}

不过,假如生成器函数内部处理了这个错误,那么生成器就不会关闭,而且还可以恢复执行。错误处理会跳过对应的 yield,因此在这个例子中会跳过一个值。比如:

function* generatorFn() {
for (const x of [1, 2, 3]) {
try {
yield x;
} catch (e) {}
}
}

const g = generatorFn();

console.log(g.next()); // { done: false, value: 1}
g.throw('foo');
console.log(g.next()); // { done: false, value: 3}

在这个例子中,生成器在 try/catch 块中的 yield 关键字处暂停执行。在暂停期间,throw() 方法向生成器对象内部注入了一个错误:字符串"foo"。这个错误会被 yield 关键字抛出。因为错误是在生成器的 try/catch 块中抛出的,所以仍然在生成器内部被捕获。可是,由于 yield 抛出了那个错误,生成器就不会再产出值 2。此时,生成器函数继续执行,在下一次迭代再次遇到 yield 关键字时产出了值 3。

备注

如果生成器对象还没有开始执行,那么调用 throw() 抛出的错误不会在函数内部被捕获,因为这相当于在函数块外部抛出了错误。