宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取
小编给大家分享一下python读取.mtx文件的方法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
Python主要用来做什么
Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;4、嵌入式应用开发;5、游戏开发;6、桌面应用开发。
mtx文件是按照稀疏矩阵格式存储的矩阵数据,可以按照以下步骤读取:
1、安装scanpy包
pip install scanpy
2、文件读取
import scanpy as sc adata = sc.readfilename) data = adata.X
第一行read之后返回的是annData,第二行通过.X操作得到的是矩阵数据
3、转换为稠密矩阵
data = data.todense)
直接得到的矩阵是稀疏形式的,通过todense函数可转换为稠密矩阵
补充:python读取各种文件方式
Json:
use_time=[] with openaddress,'r') as f: #ubuntu mobile = json.loadf) calls = mobile["transactions"][0]["calls"] for call in calls: use_time.appendstrcall['use_time']))
Excel:
rawdata1=open_workbookaddress) rawdata=rawdata1.sheet_by_index0) for i in range1,rawdata.nrows): if rawdata.celli,date_index).value=="": #跳过空行 continue else: if ctype==3: #若为3,则用datetime模块处理日期 date1=rawdata.celli,date_index).value date2 = xldate_as_tupledate1,0) date3=datetime*date2) if "." in strrawdata.celli,phone_index).value): phone1=strrawdata.celli,phone_index).value)[:-2] else: phone1=strrawdata.celli,phone_index).value)
写EXCEL:
Excel_file = xlwt.Workbook) sheet = Excel_file.add_sheet'sheet0') header=[u'号码','日期top1','日期top2','日期top3'] #写入标题行: for i in rangelenheader)): sheet.write0,i,header[i]) #开始按行写入数据: for i in rangelenphonelist)): sheet.writei+1,0,phonelist[i]) sheet.writei+1,1,dic[strphonelist[i])]) #保存EXCEL: Excel_file.save"C:/Users/Desktop/100个文件输出xls/"+strfileName)+".xls")
CSV:
rawdata=pd.read_csvaddress,skip_blank_lines=True) #参数为去除空行 if 'start_time' or 'begin_time' in rawdata.columns: if 'start_time' in rawdata.columns: start_time=rawdata['start_time'] elif 'begin_time' in rawdata.columns: start_time=rawdata['begin_time']
txt:
rawdata=openaddress,'r') i=0 a=[] #c存放第一行的列名 for line in rawdata: if i==1: #默认第二行开始存储通话数据 a=line.split',') #逗号作为分隔符 for j in rangelena)): #查找指定列名所在的列下标 if '-' in stra[j]))or'/' in stra[j]))): #判断日期所在列数 date_index=j #保存日期的列下标 elif stra[j]).isdigit) and lenstra[j]))>5: #默认全为数字组成的字符串为电话号码 phone_index=j else: pass break else: i+=1 i=0 for line in rawdata:#开始转存数据: if lenline)<10: #跳过空行 continue data_line=line.split',') #txt默认以','分隔数据 if i==0: pass #第一行为列名,跳过 i+=1 else: #从第二行开始保存数据 start_time.appenddata_line[date_index])