日韩欧美视频一区-日韩欧美三区-日韩欧美群交P内射捆绑-日韩欧美精品有码在线播放免费-成人免费一区二区无码视频-成人免费一级毛片在线播放视频

SCI期刊 | 網站地圖 周一至周日 8:00-22:30
你的位置:首頁 >  心理健康教育論文 ? 正文

中職生心理健康教育中分類技術的運用

2021-4-10 | 心理健康教育論文

1數據準備

1.1數據選擇

本文采用癥狀自評量表(SCL-90),通過對某中職學校2011級學生進行心理健康狀況測試得到的數據,發出問卷413份,其中有效問卷377份,有效率為91.3%。

1.2數據預處理

數據挖掘的目的是從日常業務數據中抽取一些有價值的知識或信息,但實際的數據庫太大,極易受噪聲數據、空缺數據和不一致性數據的侵擾,這就給后續的數據分析和數據挖掘帶來極大的不便,甚至導致錯誤的結論,所以有必要對數據進行預處理。經驗表明,只有通過前期細致的數據準備工作,才能在數據挖掘過程中節省挖掘的時間,提高挖掘的效率,得到高質量的挖掘結果。常見的數據預處理方法有多種,包括數據抽取、數據清洗、數據集成、數據變換等。

1)數據抽取

在數據挖掘過程中一般并不需要使用所有的數據,有些數據對構建數據模型干擾不大,有些數據會降低挖掘計算的效率,甚至可能導致謬誤,并且這些數據對最終的數據分析沒有任何益處,也不會影響正確結論的獲得。因此,根據所定義的項目任務,確定所需的數據源,并從中收集和提取數據,查找數據屬性特征,減少數據規模,使得在不影響數據分析基礎上最大可能地精簡數據量,方便挖掘出數據之間隱含的規律和內在的聯系。在收集到的中職學生心理健康測試數據中有很多屬性,其中有一些屬性與挖掘任務之間沒有太大關系,或數據本身沒有挖掘的意義。如學生的學號、姓名、ID號等屬性,這些屬性值都是唯一性的,而且數據量又很大,只會增加挖掘計算的時間和空間,可以直接刪除。另外,像民族、出生年月、學生類別之類的屬性,由于選取的數據中有八成以上為漢族學生,全部是2011級,類別過于集中,沒有分類的意義,對挖掘的結果影響不大,因此在數據提取時也需要清除這部分屬性值,使得數據規模得以降低。根據中職學生心理健康數據的特點,經過數據抽取,確定了與挖掘任務相關的學生基本屬性是性別、獨生子女、專業、家庭所在地,分別對軀體化、強迫癥狀、人際關系敏感、抑郁、焦慮、敵對、恐怖、偏執、精神病性等十個心理癥狀進行挖掘。

2)數據清洗

數據清洗目的是通過檢測數據中存在的錯誤和不一致來清理數據,包括空值處理、噪聲處理及不一致數據的處理等。該文所使用的數據集在收回癥狀自評量表時已經對數據的有效性做了初步的篩選,剔除了存在較大缺失的測試數據。因此,在數據清理這個環節主要針對數據中的不完整性、不一致性進一步篩查,確保數據的有效性。在心理測試過程中,由于學生填涂不規范、錯填或者其他因素干擾等原因,導致數據不完整,會產生大量的噪聲數據。這些錯誤數據和空值數據、重復數據需要通過預處理方法進行數據清洗。經過對數據空值及不一致性的清理后,所得到的數據質量有了很大的提高,保證了數據挖掘結果的準確性和有效性。

3)數據轉換

數據轉換的基本原則是連續型數據離散化,離散型數據類別化。源數據中有些數據是連續型的,還有些數據雖是離散型,但其分類太多,如家庭所在地屬性值分散較廣,專業屬性值有多個等,不利于進行數據挖掘,必須轉換。另外,為了提高挖掘的效率,必須規范數據格式,中文屬性值可用一些英文字符或數字編號替代。

2數據分類規則挖掘方法-基于決策樹模型的方法

數據分類是數據挖掘技術的主要組成部分,采用KDD技術對數據進行有效分析。它能找出描述數據類或概念的模型,以便能使用模型預測類來標記未知的對象類。在眾多的分類挖掘技術中,決策樹方法以其算法容易理解,易生成分類規則等優點被廣泛研究和應用。

2.1決策樹概述

決策樹方法首先對數據進行處理,構建分類模型,生成決策樹,利用生成的分類規則對新數據進行分析。本質上決策樹是通過一系列規則對數據進行分類的過程。決策樹是一個可以自動對數據進行分類的倒置樹形結構,采用自頂向下的遞歸方式,對它的每個內部節點進行一個屬性上的測試,對每個節點上問題的不同回答引出兩個或多個分支,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。決策樹中最頂層的節點稱為根節點,是整個決策樹的開始。每個節點代表一個屬性,并根據屬性值的不同判斷該節點向下的分支,最終會到達葉節點。其中每個分支代表它所連接的上節點在其屬性上的可能取值,每個葉節點對應一個類別。根據類別屬性建立一個類似流程圖的樹形結構,從根結點到葉結點的一條路徑就形成了一個分類規則,整個決策樹就相應形成一組析取規則,這樣就很容易轉換成IF-THEN形式的分類規則,根據這個分類規則就可以比較容易地對新數據進行分類識別和預測。

2.2ID3算法

生成決策樹的一個著名算法是ID3算法,是由Quinlan等人于1986年提出的,其基本思想是自頂向下遞歸地搜索訓練樣本集,在每個節點處測試每一個屬性,從而構成決策樹。ID3算法在每個非葉節點選擇信息增益最大的屬性作為測試屬性。ID3算法的核心是確定分支準則,即如何從眾多的屬性變量中選擇一個最佳的分裂屬性。通常,在樹的每個非葉節點選擇具有信息增益最大的屬性作為當前節點的測試屬性,使得對結果劃分中的樣本分類所需的信息量最小,并確保找到一棵相對簡單的樹。算法計算每個屬性的信息增益,具有最高信息增益的屬性選作給定集合的根節點,然后依次比對節點和訓練樣本中的其他屬性值,完成對訓練樣本的劃分。

3基于決策樹的中職學生心理健康模型的發現

將汽車制造與檢修、計算機網絡技術、機電技術應用三個專業學生的數據抽出,共有242條記錄作為訓練數據集進行決策樹挖掘。具體包含了中職學生相關屬性(性別、獨生子女、專業、家庭所在地)和癥狀自評量表10個維度(軀體化、強迫癥狀、人際關系敏感、抑郁、焦慮、敵對、恐怖、偏執、精神病性、其他)共14個字段。這里,將挖掘任務具體為分析焦慮癥狀與中職學生的哪些屬性相關,其相關程度如何。因此,選擇性別、獨生子女、專業、家庭所在地以及焦慮作為決策樹挖掘字段,生成如圖1所示決策樹。其中用JL1和JL2分別代表學生有焦慮癥狀和無焦慮癥狀。采用決策樹的最大特點就是能方便地提取分類規則,并使用IF...THEN形式表示對應的分類規則。IF...THEN規則就是從根節點到葉節點的每條路徑生成一個規則,據此可以得到如下判定學生是否焦慮的規則:IF獨生子女=“是”and專業=“機電技術應用”and性別=“男”and家庭所在地=“農村”THEN有焦慮癥狀;IF獨生子女=“是”and專業=“機電技術應用”and性別=“男”and家庭所在地=“中小城市”THEN無焦慮癥狀;IF獨生子女=“是”and專業=“計算機網絡技術”and性別=“男”THEN有焦慮癥狀;IF獨生子女=“是”and專業=“計算機網絡技術”and性別=“女”THEN無焦慮癥狀;IF獨生子女=“否”and專業=“汽車制造與檢修”and性別=“男”and家庭所在地=“農村”THEN無焦慮癥狀;IF獨生子女=“否”and專業=“汽車制造與檢修”and性別=“女”and家庭所在地=“農村”THEN有焦慮癥狀;……從生成的決策樹可以看出,與焦慮癥狀最為相關的學生屬性是是否獨生子女,其次是專業。從圖中可以得出以下結論:獨生子女的焦慮程度明顯高于非獨生子女,男生的比例明顯高于女生,男生中為獨生子女、專業為機電技術應用且來自農村或小城鎮的學生焦慮癥狀比較普遍。根據分析的結果,在進行與焦慮癥狀相關的心理咨詢、心理輔導工作中,應對獨生子女、農村或小村鎮、機電技術應用專業男生等容易出現心理問題的群體給予特別的關注,予以適當的引導、幫助,降低心理健康問題對學生成長的影響。

4結束語

中職學生心理健康問題十分內隱,外人無法直接感知,很難體會到有心理疾病學生矛盾、困惑乃至痛苦的內心處境。通過對分類規則挖掘方法的闡述,輔以具體實例進行描述,生成決策樹,并提取相應的分類規則,方便學校心理咨詢老師和學生管理部門對心理問題比較集中的中職學生人群進行提前干預,盡力控制心理疾病的發生,以提高中職學生的心理健康教育水平,讓中職學生能夠走出心理困境,健康成長。

本文作者:方勝 單位:安徽電氣工程學校

Top
主站蜘蛛池模板: 国产精品一区二区在线观看 | 国产一区免费在线观看 | 欲乱艳荡少寡妇全文免费 | 野花日本手机观看大全免费3 | 日日踫夜夜爽无码久久 | 亚洲免费在线播放 | 暖暖日本大全免费观看 | 国产精选视频在线观看 | 一个人免费播放高清在线观看 | 国产免费怕怕免费视频观看 | xx69中国| 国产乱码卡二卡三卡4W | 嫩草欧美曰韩国产大片 | 人人在线碰碰视频免费 | 精品一区二区三区免费毛片 | 后入内射国产一区二区 | 我就去色色 | 福利片福利一区二区三区 | 一本道dvd久久综合高清免费 | 天天爽夜夜爽8888视频精品 | 国产午夜精品AV一区二区麻豆 | 国内精品自产拍在线少密芽 | 在线播放性xxx欧美 在线播放午夜理论片 | 国精产品一区一区三区M | 国产精品.XX视频.XXTV | 男人的天堂黄色 | 在线视频 国产 日韩 欧美 | 色色色久久久免费视频 | 亚洲AV久久无码精品国产网站 | 牛和人交videos欧美 | 果冻传媒妈妈要儿子 | 午夜办公室在线观看高清电影 | 69亞洲亂人倫AV精品發布 | 日本xxxxxx片免费播放18 | 久久精品国产亚洲精品2020 | 影音先锋av333资源网 | 窝窝影院午夜看片毛片 | 国产精品JIZZ视频免费 | 18video性欧美19sex高清 | 熟女人妻-蜜臀AV-首页 | 无码人妻精品一区二区蜜桃色 |