久久亚洲中文字幕精_精品国产一区二区三区不卡_99久久久无码国产精品免费手机_国产亚洲精品久久久久动漫

將想法與焦點和您一起共享

范例推理下旅游計劃推薦系統(tǒng)設(shè)計的關(guān)鍵問題發(fā)布者:本站     時間:2020-05-03 11:05:52

隨著我國旅游業(yè)和互聯(lián)網(wǎng)電子商務(wù)的迅猛發(fā)展,互聯(lián)網(wǎng)上的旅游電子商務(wù)網(wǎng)站成百上千,而這些網(wǎng)站提供的旅游相關(guān)信息堪稱海量。這為普通游客設(shè)計自己的旅游計劃提供了豐富的選擇和參考,但同時也大大增加了 信 息 篩 選 和 比 對 的 難 度。例 如,使 用“百 度”搜 索 引 擎 檢 索 關(guān) 鍵 字“九 寨 溝 三 日 游”,檢 索 結(jié) 果 獲 得23 800 000個頁面。為此,建立一個第三方網(wǎng)站,通過“推薦系統(tǒng)”向游客提供旅游計劃個性化服務(wù)具有很高的實用價值和商業(yè)價值。傳統(tǒng)的“推薦系統(tǒng)”一般基于用戶的歷史記錄(例如網(wǎng)頁瀏覽記錄、產(chǎn)品購買記錄、對產(chǎn)品的評價或評分等)設(shè)計推薦算法,但旅游活動不同于一般的產(chǎn)品消費,即游客一般不會重復(fù)地旅游或者頻繁地旅游。因此,旅游電子商務(wù)網(wǎng)站的“推薦系統(tǒng)”有必要選擇其他 理論和技術(shù)作為基礎(chǔ)。比較普遍的情況是,游客對于自己將進行的旅游活動僅有一些初步的想法(例如時間、費用、旅游地點等),對于具體行程安排不太了解,所以在制定旅游計劃的過程中往往喜歡參考別人的旅游計劃或者經(jīng)驗,并以此作為自己旅游計劃的基礎(chǔ)和依據(jù),修改這些例子以形成自己的旅行計劃。有鑒于此,范例推理(Case-based Reasoning)理論和技術(shù)可運用到旅游電子商務(wù)網(wǎng)站的“推薦系統(tǒng)”設(shè)置中。范例推理理論和技術(shù)起源于美國,是人工智能領(lǐng)域中較新穎和成熟的一種問題求解和學(xué)習(xí)方法。它的基本思路是在新問題的解決過程中,通過尋找與之相似的歷史范例,挖掘歷史范例中可資借鑒的信息和知識,進而形成新問題的對應(yīng)解決方案?;诜独评淼膯栴}求解過程的可以分為4個階段:范例檢索(Retrieve)、范例重用(Reuse)、范例修正(Revise)和范例保存(Retain)。

1 機構(gòu)框架

基于范例推理的旅游計劃推薦系統(tǒng)由三個層次構(gòu)成,即游客應(yīng)用層、Web服務(wù)層和數(shù)據(jù)源層,見圖1.
(1)游客應(yīng)用層。該層為游客訪問推薦系統(tǒng)提供一個的良好的交互操作界面,游客可輸入文字、數(shù)字等信息,瀏覽、修改和保存旅游計劃推薦系統(tǒng)的輸出結(jié)果。(2)Web服務(wù)層。該層負責(zé)從數(shù)據(jù)源中檢索、更新數(shù)據(jù)。旅游計劃推薦系統(tǒng)運行在該層。該層主要模塊包括管理模塊(負責(zé)和“游客應(yīng)用層”相互作用,管理其他模塊、維護“數(shù)據(jù)源層”、檢索模塊(負責(zé)CBR技術(shù)中的檢索、匹配功能)。(3)數(shù)據(jù)源層。該層包括旅游計劃收集庫、旅游計劃范例庫和游客資料庫等。其中,旅游計劃收集庫包含大量采集自各網(wǎng)站的、未經(jīng)整理的旅游信息資料;旅游計劃范例庫包含大量的標(biāo)準化的旅游計劃范例;游客資料數(shù)據(jù)庫包含著登陸游客的相關(guān)歷史記錄。

旅游計劃推薦系統(tǒng)結(jié)構(gòu)

2 關(guān)鍵技術(shù)與方法

基于范例推理理論和技術(shù),本文將范例推理系統(tǒng)作為旅游計劃推薦系統(tǒng)的核心組成部分。為了保證旅游計劃推薦系統(tǒng)正常運作,該范例推理系統(tǒng)必須解決3個關(guān)鍵問題,即旅游計劃采集系統(tǒng)、旅游計劃范例庫和旅游計劃范例檢索設(shè)計。

(1)旅游計劃采集系統(tǒng)。旅游計劃范例的搜集工作主要依賴旅游計劃自動采集系統(tǒng)進行。該系統(tǒng)通過“URL模板匹配庫”過濾出可以解析的網(wǎng)頁,然后將可解析的HTML文檔進行網(wǎng)頁結(jié)構(gòu)化處理,生成XML文檔。最后結(jié)合DOM4J和XPath語言建立頁面解析模板,從XML文檔中抽取指定節(jié)點信息,并將其存儲進入旅游計劃收集庫。旅游計劃采集系統(tǒng)工作流程參見圖二。需要說明的是,筆者將XML語言應(yīng)用在網(wǎng)頁信息自動抽取過程中。XML是一種元標(biāo)記語言,它將結(jié)構(gòu)、內(nèi)容和表現(xiàn)分離,提供描述結(jié)構(gòu)化資料的格式,有著較好的數(shù)據(jù)存儲格式,可擴展性,高度結(jié)構(gòu)化,語義性強、能夠解決HTML網(wǎng)頁的數(shù)據(jù)的異構(gòu)性和半結(jié)構(gòu)化問題。URL模板匹配庫是一個包含了旅游電子商務(wù)網(wǎng)站URL特征的XML文件,與待抽取網(wǎng)頁的URL進行模板匹配,判斷頁面是否可以被解析并確定其網(wǎng)頁解析模板。XPath(XML Path Language)是一種在XML文檔中查找信息的語言,可用來在XML文檔中對元素和屬性進行遍歷。用DOM4J解析器可以從指定的XML文檔中自動抽取出所需信息。
 旅游計劃采集系統(tǒng)工作流程

(2)旅游計劃范例庫。各旅游商務(wù)網(wǎng)站提供的旅游計劃包含大量信息,內(nèi)容側(cè)重點和格式等大相徑庭,因此必須將這些旅游計劃進行標(biāo)準化處理,即將一個個旅游計劃依據(jù)需要事先確立旅游計劃范例模板轉(zhuǎn)化為旅游計劃。該范例模版既能夠最大限度地反應(yīng)普通游客對旅游計劃的諸多關(guān)注要點,而且信息應(yīng)該言簡意賅,一目了然。為了更好的了解普通游客對旅行計劃的關(guān)注要點,筆者與Phuket ABC Tour合 作 進 行 了 旅 游 計 劃 網(wǎng)絡(luò)問卷調(diào)查,歷時30天,獲得“旅游計劃問卷調(diào)查表”100份(該問卷調(diào)查表調(diào)研對象為普通游客,調(diào)研主要內(nèi)容為對旅游計劃的關(guān)注要點進行排序和打分)“旅游計 劃問卷調(diào)查表”統(tǒng)計結(jié)果顯示,普通游客對旅游計劃的關(guān)注要點由強到弱排序為景點、時間、費用、住宿、餐飲、交通。為此,筆者設(shè)計了一個旅游計劃范例模版(以成都國旅的九寨溝三日游為例),見表1.旅游計劃范例庫存儲有大量旅游計劃范例,并且能夠不斷補充的新的旅游計劃范例。
 旅游計劃范例模版

(3)旅游計劃范例檢索。與旅游計劃范例模板相匹配,筆者設(shè)計了新旅游計劃模版,游客可根據(jù)自身需要選填各項。新旅游計劃模版見表2.表2中,“關(guān)注程度排序”可理解為游客賦予各“關(guān)注要點”的權(quán)重;“時間”和“費用”兩項為數(shù)值,“地點”、“住宿”、“餐 飲”、“景 點”、“交通”和“旅游對象”項為字符。假設(shè)新旅游計劃與旅游計劃范例分別表示為t和s,fti和fsi分別表示新 旅 游 計 劃 和 旅 游 計 劃 范 例 的 第i個“關(guān)注要點”的數(shù)值或字符。
新旅游計劃模版

對于旅游活動的“時間”和“費用”而言,如果新旅游計劃設(shè)定的數(shù)值與旅游計劃范例的數(shù)值之間差距過大,則游客 一般 難 以 接 受,例 如5 000元與50 000元之間的差距,5天與10天之間的差距。故根據(jù)生活常識設(shè)定兩者差距介于0.5和1.5倍之間為有效相似度,否則為無效相似度。

公式一

地點“、”住宿“、”餐飲“、”景點“、”交通“和”旅游對象“等字符項目相似性計算公式為

公式二

將單個關(guān)注要點的相似度與其權(quán)重相乘(w{1,2,3…7}),其結(jié)果再相加得到新旅游計劃與旅游計劃范例的總體相似度??傮w相似度越大,說明新旅游計劃與旅游計劃范例越相似。旅游計劃范例按照總體相似度降序輸出。



選擇我們,優(yōu)質(zhì)服務(wù),不容錯過
1. 優(yōu)秀的網(wǎng)絡(luò)資源,強大的網(wǎng)站優(yōu)化技術(shù),穩(wěn)定的網(wǎng)站和速度保證
2. 15年上海網(wǎng)站建設(shè)經(jīng)驗,優(yōu)秀的技術(shù)和設(shè)計水平,更放心
3. 全程省心服務(wù),不必擔(dān)心自己不懂網(wǎng)絡(luò),更省心。
------------------------------------------------------------
24小時聯(lián)系電話:021-58370032
三门县| 枣强县| 根河市| 康保县| 寿阳县| 乌拉特后旗| 黄石市| 长垣县| 拉孜县| 红河县| 杭锦后旗| 定日县| 全州县| 新乐市| 唐山市| 呼玛县| 万载县| 盐边县| 大丰市| 嘉峪关市| 永川市| 博兴县| 松阳县| 大竹县| 福建省| 利川市| 大庆市| 海晏县| 绍兴市| 锦屏县| 微博| 札达县| 曲松县| 光泽县| 凤阳县| 蛟河市| 兴和县| 瓦房店市| 秦安县| 襄城县| 广宗县|