Java编程通过匹配合并数据实例解析(数据预处理)
本文研究的主要是Java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。
数据描述
以下程序是对如下格式的数据进行合并处理。
这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。
这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。
问题描述
在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。
数据处理程序
package deal; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader; import java.math.BigDecimal; import java.util.ArrayList; import java.util.HashMap; import java.util.List; /* * author:合肥工业大学 管院学院 钱洋 * email:1563178220@qq.com */ public class GetPUser { public static List<String> readDocs(String docsPath,String code) throws IOException{ BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code)); String s=null; List<String> userproductscore=new ArrayList<String>(); while ((s=reader.readLine())!=null) { userproductscore.add(s); } reader.close(); return userproductscore; } public static HashMap<String, String> MAPread(String docsPath1,String code1) throws IOException{ BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath1)),code1)); String s1=null; HashMap<String,String> userfeaturemap=new HashMap<String,String>(); while ((s1=reader1.readLine())!=null) { String arr[]=s1.split("\t"); String feature=""; for (int i = 1; i < arr.length; i++) { BigDecimal db = new BigDecimal(arr[i]); String ii = db.toPlainString(); feature+=ii+" "; } userfeaturemap.put(s1.split("\t")[0], feature); } reader1.close(); return userfeaturemap; } public static List<String> match(List<String> userproductscore,HashMap<String, String> userfeaturemap) throws IOException{ List<String> userscoreandfeature=new ArrayList<>(); for (int i = 0; i < userproductscore.size(); i++) { //获取用户id String user_id=userproductscore.get(i).split("\t")[0]; //获取用户特征 String userfeature = userfeaturemap.get(user_id); userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature); System.out.println(userproductscore.get(i)+"\t"+userfeature); } return userscoreandfeature; } public static void main(String[] args) throws IOException { //读取两个文本 List<String> userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk"); HashMap<String, String> userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8"); //匹配结果 match(userproductscore,userfeaturemap); } }
总结
以上就是本文关于Java编程通过匹配合并数据实例解析(数据预处理)的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!
上一篇:Java编程swing组件JLabel详解以及使用示例
栏 目:Java编程
本文标题:Java编程通过匹配合并数据实例解析(数据预处理)
本文地址:https://www.xiuzhanwang.com/a1/Javabiancheng/8367.html
您可能感兴趣的文章
- 01-10Java咖啡馆(1)——叹咖啡
- 01-10Java Socket编程(三) 服务器Sockets
- 01-10Java进阶:Struts多模块的技巧
- 01-10Java Socket编程(一) Socket传输模式
- 01-10Java Socket编程(二) Java面向连接的类
- 01-10Java运行时多态性的实现
- 01-10Java经验点滴:处理没有被捕获的异常
- 01-10Java Socket编程(四) 重复和并发服务器
- 01-10Java中的浮点数分析
- 01-10面向对象编程:Java中的抽象数据类型
阅读排行
本栏相关
- 01-10Java咖啡馆(1)——叹咖啡
- 01-10JVM的垃圾回收机制详解和调优
- 01-10Java Socket编程(三) 服务器Sockets
- 01-10Java进阶:Struts多模块的技巧
- 01-10J2SE 1.5版本的新特性一览
- 01-10Java Socket编程(一) Socket传输模式
- 01-10Java运行时多态性的实现
- 01-10Java Socket编程(二) Java面向连接的类
- 01-10Java Socket编程(四) 重复和并发服务
- 01-10Java经验点滴:处理没有被捕获的异常
随机阅读
- 08-05dedecms(织梦)副栏目数量限制代码修改
- 08-05DEDE织梦data目录下的sessions文件夹有什
- 01-10C#中split用法实例总结
- 01-10SublimeText编译C开发环境设置
- 01-11ajax实现页面的局部加载
- 04-02jquery与jsp,用jquery
- 01-11Mac OSX 打开原生自带读写NTFS功能(图文
- 01-10使用C语言求解扑克牌的顺子及n个骰子
- 08-05织梦dedecms什么时候用栏目交叉功能?
- 01-10delphi制作wav文件的方法