投稿

ラベル(python)が付いた投稿を表示しています

BiopythonでFASTAファイルの改行を削除する

BiopythonでFASTAファイルの改行を削除する #Biopython import sys from Bio import SeqIO def delete_LF(fasta_file):     for record in SeqIO.parse(fasta_file, "fasta"):         desc = record.description         seq = str(record.seq)         print(">{0}\n{1}".format(desc, seq)) if __name__ == '__main__':     fasta = sys.argv[1]     delete_LF(fasta)

連番や等差数列を生成

連番や等差数列を生成 1,2,3...などリストを作成するとき。 # 0から任意の値までの連番  range(stop) # 任意の範囲の連番 range(start, stop) #任意の範囲、増分の等差数列 range(start, stop, step) #python

Biopythonのインストール

#インストール ```bash sudo pip install biopython ``` #アンインストール ```bash sudo pip uninstall biopython ``` #biopython

Biopython

introduce how to use biopython Biopythonの使い方を紹介します。

Python

概要 ここでは私が学んだPythonの使い方を書いていきます。 #matplotlib の使い方 #python #informatics %matplotlib inline import matplotlib.pyplot as plt 散布図 plt.scatter(df['median_income'], df['median_house_value']) ヒストグラム plt.hist(df['median_house_value'], bins=50) ボックスプロット(箱ひげ図) plt.boxplot((df['total_bedrooms'], df['population'])) #pandas の使い方 #python #informatics #インポート import pandas as pd #データの読み込み ##tsv pd.read_csv( 'foo.txt', sep='\t' ) #ざっとながめる df.describe() #要素の出現回数 vc = df['state'].value_counts() # 任意の列だけ取り出したい場合 df[['name', 'kcal']] # datetime列をindexにする df.set_index('datetime', inplace=True) #任意の行だけ取り出したい場合 df[100:106] # 条件を指定して抽出 df[df['kcal'] > 450] # queryメソッドを使うと、複数条件の指定で、特定カラムだけ出力もできる df[['name', 'kcal']].query('kcal > 450 and name == "豚肉の生姜焼"') # カラム名を変更する(y を sales に変換) df.rename(columns={'y': 'sales&

ファイルを日付によるフォルダに分類する

#python import os import shutil import datetime #ディレクトリのパスを変数に代入する。 MY_DIR = 'photo/' # os.listdirで、phtoディレクトリ内のファイルの名前をfilesのリストに入れる files = os.listdir('photo') #files リスト内の、要素を一つずつ取り出す for i in files: mtime = os.path.getmtime(MY_DIR + i) # os.path.getmtimeでファイルができた時間を秒でゲットする。 dt = datetime.datetime.fromtimestamp(mtime) #秒から日付データを入手できる dpath = MY_DIR + dt.strftime('%Y%m%d') #19070301などの形式で日付を入手できる if os.path.isdir(dpath) == False: #もし、dpathというフォルダが存在しないならその名前のフォルダを作る os.mkdir(dpath) shutil.move(MY_DIR + i, dpath) #ファイルを作ったフォルダに移す

機械学習

機械学習とはなにか 人工知能の一部。学習用データセットを使って訓練した後に、未知の例について正確に判断できるアルゴリズムの能力。 学習の種類は以下の3つ 1.教師なし学習 2.教師あり学習 3.強化学習 教師あり学習 KNN(K近傍法) あるプロットのグループの中に、一つのプロットを置く。その中で、最も近いプロットと同じグループにするのが、最近傍法。 K=3にして、近い3つのプロットをしらべる。3つのうち、2つ以上が赤だと、そのプロットも赤に属する。 knn.py import cv2 as cv import numpy as np import matplotlib.pyplot as plt # Feature set containing (x,y) values of 25 known/training data trainData = np . random . randint ( 0 , 100 ,( 25 , 2 )) . astype ( np . float32 ) # Labels each one either Red or Blue with numbers 0 and 1 responses = np . random . randint ( 0 , 2 ,( 25 , 1 )) . astype ( np . float32 ) # Take Red families and plot them red = trainData [ responses . ravel () == 0 ] plt . scatter ( red [:, 0 ], red [:, 1 ], 80 , 'r' , '^' ) # Take Blue families and plot them blue = trainData [ responses . ravel () == 1 ] plt . scatter ( blue [:, 0 ], blue [:, 1 ], 80 , 'b' , 's' ) plt . show () #ne