首頁技術(shù)文章正文

前端培訓(xùn)之lazy.js 惰性求值實(shí)現(xiàn)分析

更新時(shí)間:2017-05-17 來源:黑馬web前端培訓(xùn)學(xué)院 瀏覽量:

前端培訓(xùn)之lazy.js 惰性求值實(shí)現(xiàn)分析
來看一個(gè) lazy.js 主頁提供的示例:

1
2
3
4
5
6
var people = getBigArrayOfPeople();
var results = _.chain(people)
  .pluck('lastName')
  .filter(function(name) { return name.startsWith('Smith'); })
  .take(5)
  .value();
上例中,要在非常非常多的人里面,找出 5 個(gè)以 Smith 開頭的 lastName。如果在上面的 pluck() 和 filter() 的過程中,每一步都產(chǎn)生了臨時(shí)數(shù)組,也就是說對上一步返回的數(shù)據(jù)執(zhí)行了一次循環(huán)、處理的過程,那么整個(gè)查找的過程可能會花費(fèi)很長的時(shí)間。
不采用上面的這種寫法,單純?yōu)榱诵阅芸紤],可以這樣處理:

1
2
3
4
5
6
7
8
9
10
var results = [];
for (var i = 0; i < people.length; ++i) {
  var lastName = people[i].lastName;
  if (lastName.startsWith('Smith')) {
    results.push(value);
    if (results.length === 5) {
      break;
    }
  }
}
首先,對于原始數(shù)據(jù),只做一次循環(huán),單次循環(huán)中完成所有的計(jì)算。其次,由于只需要 5 個(gè)最終結(jié)果,所以,一旦得到了 5 個(gè)結(jié)果,就終止循環(huán)。
采取這種處理方法,對于比較大的數(shù)組,在計(jì)算性能上應(yīng)該會有明顯的提升。
不過,如果每次遇到這種類似的情形,為了性能,都要手寫這樣的代碼,有點(diǎn)麻煩,而且代碼不清晰,不便于理解、維護(hù)。第一個(gè)例子中的寫法要好些,明顯更易讀一些,但是對于性能方面有些擔(dān)憂。
所以,如果可以結(jié)合第一個(gè)例子中的寫法,但又能有第二個(gè)例子中的性能提升,豈不是很好?
接下來再說說“惰性求值”了。
Lazy evaluation – wikipedia
https://en.wikipedia.org/wiki/Lazy_evaluation
In programming language theorylazy evaluation, or call-by-need is an evaluation strategy which delays the evaluation of an expression until its value is needed (non-strict evaluation) and which also avoids repeated evaluations (sharing).
用我的話來表達(dá),惰性求值就是:對于一個(gè)表達(dá)式,在不需要值的時(shí)候不計(jì)算,需要的時(shí)候才計(jì)算。
JavaScript 并非從語言層面就支持這樣的特性,而是要通過一些技術(shù)來模擬、實(shí)現(xiàn)。
首先,不能是表達(dá)式,表達(dá)式在 JS 中是立即求值的。所以,要像第一個(gè)例子中的那樣,將求值的過程包裝為函數(shù),只在需要求值的時(shí)候才調(diào)用該函數(shù)。
然后,延遲計(jì)算還需要通過“精妙的”設(shè)計(jì)和約定來實(shí)現(xiàn)。對于第一個(gè)例子,pluck()、filter()、take() 方法在調(diào)用時(shí),不能直接對原始數(shù)據(jù)進(jìn)行計(jì)算,而是要延遲到類似 value() 這樣的方法被調(diào)用時(shí)再進(jìn)行。
在分析 Lazy.js 的惰性求值實(shí)現(xiàn)前,先總結(jié)下這里要討論的借助惰性求值技術(shù)來實(shí)現(xiàn)的目標(biāo):
  • 良好的代碼可讀性
  • 良好的代碼執(zhí)行性能
而對于 Lazy.js 中的惰性求值實(shí)現(xiàn),可以總結(jié)為:
  • 收集計(jì)算需求
  • 延遲并優(yōu)化計(jì)算的執(zhí)行過程

分析:Lazy.js 的惰性求值實(shí)現(xiàn)

與 Underscore、Lo-Dash 不同,Lazy.js 只提供鏈?zhǔn)降?、惰性求值的?jì)算模式,這也使得其惰性求值實(shí)現(xiàn)比較“純粹”,接下來就進(jìn)入 Lazy.js 的實(shí)現(xiàn)分析了。
先看下使用 Lazy.js 的代碼(來自 simply-lazy – demo):

1
2
3
4
5
6
7
8
9
10
Lazy([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
  .map(i => i * 2)
  .filter(i => i <= 10)
  .take(3)
  .each(i => print(i))
 
// output:
// 2
// 4
// 6
注:為了書寫方法,函數(shù)定義采用 ES6 的 “=>” 語法。
這是一個(gè)有點(diǎn)無聊的例子,對 1 – 10 先進(jìn)行乘 2 運(yùn)算,然后過濾出小于 10 的值,再取前 3 個(gè)結(jié)果值輸出。
如果對上述代碼的執(zhí)行進(jìn)行監(jiān)測(參考:借助 Proxy 實(shí)現(xiàn)回調(diào)函數(shù)執(zhí)行計(jì)數(shù)),會得到以下結(jié)果:

demo – simply-lazy
map() 和 filter() 的過程都只執(zhí)行了 3 次。
先關(guān)注 map() 調(diào)用,顯然,這里沒有立即執(zhí)行計(jì)算,因?yàn)檫@里的代碼還不能預(yù)知到后面的 filter() 和 take(3),所以不會聰明地知道自己只需要執(zhí)行 3 次計(jì)算就可以了。如果沒有執(zhí)行計(jì)算,那么這里做了什么,又返回了什么呢?
先說答案:其實(shí)從 Lazy() 返回的是一個(gè) Sequence 類型的對象,包含了原始的數(shù)據(jù);map() 方法執(zhí)行后,又生成了一個(gè)新的 Sequence 對象,該對象鏈接到上一個(gè) Sequence 對象,同時(shí)記錄了當(dāng)前步驟要執(zhí)行的計(jì)算(i => i * 2),然后返回新的 Sequence 對象。后續(xù)的 filter() 和 take() 也是類似的過程。
上面的代碼也可以寫成:

1
2
3
4
5
6
7
var seq0 = Lazy([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
var seq1 = seq0.map(i => i * 2)
var seq2 = seq1.filter(i => i <= 10)
var seq3 = seq2.take(3)
 
// 求值
seq3.each(i => print(i))
在最后一個(gè)求值時(shí),已經(jīng)有一個(gè) Sequence 鏈了:

1 seq0 <- seq1 <- seq2 <- seq3
在 seq3 調(diào)用 each() 方法執(zhí)行求值前,這些鏈上的 seq 都還沒有執(zhí)行計(jì)算。那么計(jì)算的過程是怎樣的呢?其實(shí)就類似于最前面第二個(gè)例子那樣,在一個(gè)循環(huán)中,由鏈上的最后一個(gè) seq 開始,依次向前面一個(gè) seq 獲取值,再將值返回給調(diào)用方(也就是下一個(gè) seq)前,會應(yīng)用當(dāng)前 seq 的計(jì)算。
獲得第一個(gè)最終結(jié)果值的過程為:

1
2
3
4
5
6
[1] seq3 調(diào)用 seq2 獲取第 1 個(gè)值
[2] seq2 調(diào)用 seq1 獲取第 1 個(gè)值
[3] seq1 直接從 seq0 的 source 屬性對應(yīng)的原始數(shù)值取值(第 1 個(gè)值為  1)
[4] seq1 得到 1,應(yīng)用計(jì)算(i => i * 2),得到 2,返回給調(diào)用方(seq2)
[5] seq2 得到 2,應(yīng)用計(jì)算(i => i < 10),滿足條件,將 2 返回給調(diào)用方(seq3)
[6] seq3 得到 2,應(yīng)用計(jì)算(已返回值數(shù)目是否小于 3),滿足條件,將 2 返回給調(diào)用方(seq3.each)
最終,seq3.each() 得到第 1 個(gè)值(2),應(yīng)用計(jì)算(i => print(i)),將其輸出。然后繼續(xù)獲取下一個(gè)值,直到在某個(gè)過程中調(diào)用終止(這里是 take() 計(jì)算中已返回 3 個(gè)值時(shí)終止)。
除了 map()、filter()、take(),Lazy.js 還提供了更多的計(jì)算模式,不過其惰性計(jì)算的過程就是這樣了,總結(jié)為:
  • Lazy() 返回初始的 Sequence 對象
  • 惰性計(jì)算方法返回新的 Sequence 對象,內(nèi)部記錄上一個(gè) Sequence 對象以及當(dāng)前計(jì)算邏輯
  • 求值計(jì)算方法從當(dāng)前 Sequence 對象開始,依次向上一個(gè) Sequence 對象獲取值
  • Sequence 對象在將從上一個(gè) Sequence 對象獲得的值返回給下一個(gè) Sequence 前,應(yīng)用自身的計(jì)算邏輯
Lazy.js 的 Sequence 的設(shè)計(jì),使得取值和計(jì)算的過程形成一個(gè)長鏈,鏈條上的單個(gè)節(jié)點(diǎn)只需要完成上傳、下達(dá),并且應(yīng)用自身計(jì)算邏輯就可以了,它不需要洞悉整體的執(zhí)行過程。每個(gè)節(jié)點(diǎn)各司其職,最終實(shí)現(xiàn)了惰性計(jì)算。
代碼有時(shí)候勝過萬語千言,下面通過對簡化版的 Lazy.js(simply-lazy)的源碼分析,來更進(jìn)一步展示 Lazy.js 惰性計(jì)算的原理。

實(shí)現(xiàn):簡化版的 Lazy.js

Lazy.js 可以支持進(jìn)行計(jì)算的數(shù)據(jù),除了數(shù)組,還有字符串和對象。simply-lazy 只提供了數(shù)組的支持,而且只支持三種惰性求值方法:
  • map()
  • filter()
  • take()
分別看這個(gè)三個(gè)方法的實(shí)現(xiàn)。
(一)map
Lazy() 直接返回的 Sequence 對象是比較特殊的,和鏈上的其他 Sequence 對象不同,它已經(jīng)是根節(jié)點(diǎn),自身記錄了原始數(shù)據(jù),也不包含計(jì)算邏輯。所以,對這個(gè)對象進(jìn)行遍歷其實(shí)就是遍歷原始數(shù)據(jù),也不涉及惰性計(jì)算。
simple-lazy 中保留了 Lazy.js 中的命名方式,盡管只支持?jǐn)?shù)組,還是給這個(gè)類型取名為 ArrayWrapper:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
function ArrayWrapper(source) {
  var seq = ArrayLikeSequence()
  seq.source = source
  seq.get = i => source[i]
  seq.length = () => source.length
  seq.each = fn => {
    var i = -1
    var len = source.length
    while (++i < len) {
      if (fn(source[i], i) === false) {
        return false
      }
    }
    return true
  }
  seq.map = mapFn => MappedArrayWrapper(seq, mapFn)
  seq.filter = filterFn => FilteredArrayWrapper(seq, filterFn)
  return seq
}
simple-lazy 為了簡化代碼,并沒有采用 Lazy.js 那種為不同類型的 Sequence 對象構(gòu)造不同的類的模式,Sequence 可以看作普通的對象,只是按照約定,需要支持幾個(gè)接口方法而已。像這里的 ArrayWrapper(),返回的 seq 對象盡管來自 ArrayLikeSequence(),但自身已經(jīng)實(shí)現(xiàn)了大多數(shù)的接口。
Lazy 函數(shù)其實(shí)就是返回了這樣的 ArrayWrapper 對象:

1
2
3
4
5
6
function Lazy(source) {
  if (source instanceof Array) {
    return ArrayWrapper(source);
  }
  throw new Error('Sorry, only array is supported in simply-lazy.')
}
如果對于 Lazy() 返回的對象之間進(jìn)行求值,可以看到,其實(shí)就是執(zhí)行了在 ArrayWrapper 中定義的遍歷原始數(shù)據(jù)的過程。
下面來看 seq.map()。ArrayWrapper 的 map() 返回的是 MappedArrayWrapper 類型的 Sequence 對象:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
function MappedArrayWrapper(parent, mapFn) {
  var source = parent.source
  var length = source.length
  var seq = ArrayLikeSequence()
  seq.parent = parent
  seq.get = i => (i < 0 || i >= length) ? undefined : mapFn(source[i])
  seq.length = () => length
  seq.each = fn => {
    var i = -1;
    while (++i < length) {
      if (fn(mapFn(source[i], i), i) === false) {
        return false
      }
    }
    return true
  }
  return seq
}
這其實(shí)也是個(gè)特殊的 Sequence(所以名字上沒有 Sequence),因?yàn)樗雷约荷弦患?Sequence 對象是不包含計(jì)算邏輯的原始 Sequence 對象,所以它直接通過 parent.source 就可以獲取到原始數(shù)據(jù)了。
此時(shí)執(zhí)行的求值,則是直接在原始數(shù)據(jù)上應(yīng)用傳入的 mapFn。
而如果是先執(zhí)行了其他的惰性計(jì)算方法,對于得到的結(jié)果對象再應(yīng)用 map() 呢, 這個(gè)時(shí)候就要看具體的情況了,simply-lazy 中還有兩種相關(guān)的類型:
  • MappedSequence
  • IndexedMappedSequence
MappedSequence 是更通用的類型,對應(yīng) map() 得到 Sequence 的類型:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
function MappedSequence(parent, mapFn) {
  var seq = new Sequence()
  seq.getIterator = () => {
    var iterator = parent.getIterator()
    var index = -1
    return {
      current() { return mapFn(iterator.current(), index) },
      moveNext() {
        if (iterator.moveNext()) {
          ++index
          return true
        }
        return false
      }
    }
  }
  seq.each = fn => parent.each((e, i) => fn(mapFn(e, i), i))
  return seq
}
來看這里的求值(each)過程,是間接調(diào)用了其上級 Sequence 的 each() 來完成的。同時(shí)還定義了 getIterator() 接口,使得其下級 Sequence 可以從這里得到一個(gè)迭代器,對于該 Sequence 進(jìn)行遍歷。迭代器在 Lazy.js 中也是一個(gè)約定的協(xié)議,實(shí)現(xiàn)該協(xié)議的對象要支持 current() 和 moveNext() 兩個(gè)接口方法。從迭代器的邏輯中,可以看到,當(dāng) MappedSequence 對象作為其他 Sequence 的上級時(shí),如果實(shí)現(xiàn)“上傳下達(dá)”。
而 IndexedMappedSequence 的實(shí)現(xiàn)要簡單些,它的主要功能都來源于“繼承” :

1
2
3
4
5
6
7
8
9
10
11
  function IndexedMappedSequence(parent, mapFn) {
    var seq = ArrayLikeSequence()
    seq.parent = parent
    seq.get = (i) => {
      if (i < 0 || i >= parent.length()) {
        return undefined;
      }
      return mapFn(parent.get(i), i);
    }
    return seq
  }
IndexedMappedSequence 只提供了獲取特定索引位置的元素的功能,其他的處理交由 ArrayLikeSequence 來實(shí)現(xiàn)。
而 ArrayLikeSequence 則又“繼承”自 Sequence:

1
2
3
4
5
6
7
function ArrayLikeSequence() {
  var seq = new Sequence()
  seq.length = () => seq.parent.length()
  seq.map = mapFn => IndexedMappedSequence(seq, mapFn)
  seq.filter = filterFn => IndexedFilteredSequence(seq, filterFn)
  return seq
}
Sequence 中實(shí)現(xiàn)的是更一般意義上的處理。
上面介紹的這些與 map 有關(guān)的 Sequence 類型,其實(shí)現(xiàn)各有不同,的確有些繞。但無論是怎樣進(jìn)行實(shí)現(xiàn),其核心的邏輯沒有變,都是要在其上級 Sequence 的值上應(yīng)用其 mapFn,然后返回結(jié)果值給下級 Sequence 使用。這是 map 計(jì)算的特定模式。
(二)filter
filter 的計(jì)算模式與 map 不同,filter 對上級 Sequence 返回的值應(yīng)用 filterFn 進(jìn)行判斷,滿足條件后再傳遞給下級 Sequence,否則繼續(xù)從上級 Sequence 獲取新一個(gè)值進(jìn)行計(jì)算,直到?jīng)]有值或者找到一個(gè)滿足條件的值。
filter 相關(guān)的 Sequence 類型也有多個(gè),這里只看其中一個(gè),因?yàn)楸M管實(shí)現(xiàn)的方式不同,其計(jì)算模式的本質(zhì)是一樣的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
function FilteredSequence(parent, filterFn) {
  var seq = new Sequence()
  seq.getIterator = () => {
    var iterator = parent.getIterator()
    var index = 0
    var value
    return {
      current() { return value },
      moveNext() {
        var _val
        while (iterator.moveNext()) {
          _val = iterator.current()
          if (filterFn(_val, index++)) {
            value = _val
            return true
          }
        }
        value = undefined
        return false
      }
    }
  }
  seq.each = fn => {
    var j = 0;
    return parent.each((e, i) => {
      if (filterFn(e, i)) {
        return fn(e, j++);
      }
    })
  }
  return seq
}
FilteredSequence 的 getIterator() 和 each() 中都可以看到 filter 的計(jì)算模式,就是前面說的,判斷上級 Sequence 的值,根據(jù)結(jié)果決定是返回給下一級 Sequence 還是繼續(xù)獲取。
不再贅述。
(三)take
take 的計(jì)算模式是從上級 Sequence 中獲取值,達(dá)到指定數(shù)目就終止計(jì)算:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
function TakeSequence(parent, count) {
  var seq = new Sequence()
  seq.getIterator = () => {
    var iterator = parent.getIterator()
    var _count = count
    return {
      current() { return iterator.current() },
      moveNext() { return (--_count >= 0) && iterator.moveNext() }
    }
  }
  seq.each = (fn) => {
    var _count = count
    var i = 0
    var result
    parent.each(e => {
      if (i < count) { result = fn(e, i++); }
      if (i >= count) { return false; }
      return result
    })
    return i === count && result !== false
  }
  return seq
}
只看 TakeSequence 類型,與 FilteredSequence 類似,其 getIterator() 和 each() 中都提現(xiàn)了其計(jì)算模式。一旦獲得了指定數(shù)目的值,就終止計(jì)算(通過 return false)。

總結(jié)

simply-lazy 中雖然只是實(shí)現(xiàn)了 Lazy.js 的三個(gè)惰性計(jì)算方法(map,filter、take),但從中已經(jīng)可以看出 Lazy.js 的設(shè)計(jì)模式了。不同的計(jì)算方法體現(xiàn)的是不同的計(jì)算模式,而這計(jì)算模式則是通過不同的 Sequence 類型來實(shí)現(xiàn)的。
具體的 Sequence 類型包含了特定的計(jì)算模式,這從其類型名稱上也能看出來。例如,MappedArrayWrapper、MappedSequence、IndexedMappedSequence 都是對應(yīng) map 計(jì)算模式。
而求值的過程,或者說求值的模式是統(tǒng)一的,都是借助 Sequence 鏈,鏈條上的每個(gè) Sequence 節(jié)點(diǎn)只負(fù)責(zé):
  • 上傳:向上級 Sequence 獲取值
  • 下達(dá):向下級 Sequence 傳遞至
  • 求值:應(yīng)用類型對應(yīng)的計(jì)算模式對數(shù)據(jù)進(jìn)行計(jì)算或者過濾等操作
由內(nèi)嵌了不同的計(jì)算模式的 Sequence 構(gòu)成的鏈,就實(shí)現(xiàn)了惰性求值。
當(dāng)然,這只是 Lazy.js 中的惰性求值的實(shí)現(xiàn),并不意外這“惰性求值”就等于這里的實(shí)現(xiàn),或者說惰性求值的全部特性就是這里 Lazy.js 的全部特性。更何況,本文主要分析的 simply-lazy 也只是從模式上對 Lazy.js 的惰性求值進(jìn)行了說明,也并不包含 Lazy.js 的全部特性(例如生成無限長度的列表)。
不管怎樣,還是閱讀過后能夠給你帶來一點(diǎn)有價(jià)值的東西。哪怕只有一點(diǎn),我也很高興。
文中對 Lazy.js 的惰性求值的分析僅是我個(gè)人的見解,如果錯漏,歡迎指正!
 
本文版權(quán)歸黑馬程序員web前端開發(fā)學(xué)院所有,歡迎轉(zhuǎn)載,轉(zhuǎn)載請注明作者出處,謝謝!
作者:黑馬程序員web前端培訓(xùn)學(xué)院;
首發(fā):http://3rdspacecomics.com/news/web.html
分享到:
在線咨詢 我要報(bào)名
和我們在線交談!