当前位置: 首页>編程日記>正文

tensorflow实现手写数字识别

tensorflow实现手写数字识别

从torch入门的我,很排斥tensorflow, 不过最近不得不学了,不然我刚找的工作怕是要换人了。

ok,那让我们愉快的学习吧。

我们先来一个AI届的Hello World !! . 手写数字识别。然后遇到其中的问题我们再来一一解释,毕竟最快的学习方式还是项目!

这个系列是这样计划的,完成手写体识别后就直接开始尝试复现我找工作的领域中的经典推荐算法模型了。复现完成后再重新补足理论。

由于工业界对于tensorflow 1 系列的依赖太强,我们选用tensorflow 1.13.1 版本来进行。

1. 环境准备

  • tensorflow=1.13.1

2. 数据准备

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

我们看一下这个 数据规模,以train为例:

mnist.train.images.shape

得到的结果为:

(55000, 784)

这个784实际上为24*24,就是每个图片的784个像素现在被拉成一行了。我们随便取一个数据,将其拉伸回24×2424\times2424×24,就可以看到整个图片了。

import pylab
im = mnist.train.images[1]
im = im.reshape(-1,28)
pylab.imshow(im)
pylab.show()

在这里插入图片描述

既然数据如此小,我们先来试试线性回归吧。

3. 构建模型和初始化参数

线性模型没啥好说的:

y=XWT+by = \bold{X}\bold{W^T} + b y=XWT+b

其中的参数只有W\bold{W}Wbbb。对于静态图为依托的tensorflow 1.x来说,我们需要先构建完成整个模型的传输体系,然后将其放在sess中,才能真正的开始运行。

现在我们先来构建模型和参数。

对于数据来说,我们需要先指定其尺寸,但是并没有真正的数据,在运行的时候再喂进去才行。指定尺寸的方式就是用占位符:


tf.reset_default_graph()   # reconstruct the static graph
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])
x.shape,y.shape

对于初始化参数来说,这个模型中的参数无非就是包含W和b,对于卷积来说,其参数无非就是卷积核和偏置。那个在后续中会讲解。

W = tf.Variable(tf.random_normal(([784,10])))
b = tf.Variable(tf.zeros([10]))
W,b

输出


pred = tf.nn.softmax(tf.matmul(x,W)+b)

3. 定义训练过程


cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))
learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)training_epochs = 25
batch_size = 100
display_step = 1with tf.Session() as sess:sess.run(tf.global_variables_initializer())  # Init opfor epoch in range(training_epochs):avg_cost = 0total_batch = int(mnist.train.num_examples/batch_size)for i in range(total_batch):batch_xs,batch_ys = mnist.train.next_batch(batch_size)_, c = sess.run([optimizer,cost],feed_dict={x:batch_xs,y:batch_ys})avg_cost += c/total_batchif (epoch + 1)%display_step == 0:print(f"Epoch:{epoch+1},cost={avg_cost:.9f}")print("fnished")correct_prediction = tf.equal(tf.argmax(pred,1),tf.argmax(y,1))accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))print("Accuracy:",accuracy.eval({x:mnist.test.images,y:mnist.test.labels}))

我们分析一下,其与torch的不同之处,

  1. tensor训练时必须要在sess之内,否则不会真实运行
  2. tensor取数据的时候是x.next_batch(batch_size)
  3. sess.run([优化器,损失函数],feed_dict={数据字典}) --> _,cost
  4. 评估方式,method = tf.xx(), method.eval({数据字典})

ok,最后的运行结果是这样的。

Epoch:1,cost=7.546023723
Epoch:2,cost=4.171652060
Epoch:3,cost=2.972595831
Epoch:4,cost=2.377042001
Epoch:5,cost=2.016216151
Epoch:6,cost=1.779922282
Epoch:7,cost=1.617819570
Epoch:8,cost=1.489061758
Epoch:9,cost=1.393508704
Epoch:10,cost=1.312454587
Epoch:11,cost=1.255874819
Epoch:12,cost=1.191187488
Epoch:13,cost=1.152227032
Epoch:14,cost=1.099380152
Epoch:15,cost=1.076827528
Epoch:16,cost=1.038087001
Epoch:17,cost=1.014115727
Epoch:18,cost=0.983060481
Epoch:19,cost=0.969432110
Epoch:20,cost=0.936379928
Epoch:21,cost=0.926966454
Epoch:22,cost=0.899857285
Epoch:23,cost=0.897358320
Epoch:24,cost=0.867424971
Epoch:25,cost=0.862724741
fnished
Accuracy: 0.8281


https://www.fengoutiyan.com/post/14866.html

相关文章:

  • cnn手写数字识别
  • 手写cnn
  • 手写汉字识别数据集的预处理
  • tensorflow代码
  • 手写识别算法
  • tensorflow20
  • 基于神经网络的手写数字识别
  • tensorflow
  • 鏡像模式如何設置在哪,圖片鏡像操作
  • 什么軟件可以把圖片鏡像翻轉,C#圖片處理 解決左右鏡像相反(旋轉圖片)
  • 手機照片鏡像翻轉,C#圖像鏡像
  • 視頻鏡像翻轉軟件,python圖片鏡像翻轉_python中鏡像實現方法
  • 什么軟件可以把圖片鏡像翻轉,利用PS實現圖片的鏡像處理
  • 照片鏡像翻轉app,java實現圖片鏡像翻轉
  • 什么軟件可以把圖片鏡像翻轉,python圖片鏡像翻轉_python圖像處理之鏡像實現方法
  • matlab下載,matlab如何鏡像處理圖片,matlab實現圖像鏡像
  • 圖片鏡像翻轉,MATLAB:鏡像圖片
  • 鏡像翻轉圖片的軟件,圖像處理:實現圖片鏡像(基于python)
  • canvas可畫,JavaScript - canvas - 鏡像圖片
  • 圖片鏡像翻轉,UGUI優化:使用鏡像圖片
  • Codeforces,CodeForces 1253C
  • MySQL下載安裝,Mysql ERROR: 1253 解決方法
  • 勝利大逃亡英雄逃亡方案,HDU - 1253 勝利大逃亡 BFS
  • 大一c語言期末考試試題及答案匯總,電大計算機C語言1253,1253《C語言程序設計》電大期末精彩試題及其問題詳解
  • lu求解線性方程組,P1253 [yLOI2018] 扶蘇的問題 (線段樹)
  • c語言程序設計基礎題庫,1253號C語言程序設計試題,2016年1月試卷號1253C語言程序設計A.pdf
  • 信奧賽一本通官網,【信奧賽一本通】1253:抓住那頭牛(詳細代碼)
  • c語言程序設計1253,1253c語言程序設計a(2010年1月)
  • 勝利大逃亡英雄逃亡方案,BFS——1253 勝利大逃亡
  • 直流電壓測量模塊,IM1253B交直流電能計量模塊(艾銳達光電)
  • c語言程序設計第三版課后答案,【渝粵題庫】國家開放大學2021春1253C語言程序設計答案
  • 18轉換為二進制,1253. 將數字轉換為16進制
  • light-emitting diode,LightOJ-1253 Misere Nim
  • masterroyale魔改版,1253 Dungeon Master
  • codeformer官網中文版,codeforces.1253 B
  • c語言程序設計考研真題及答案,2020C語言程序設計1253,1253計算機科學與技術專業C語言程序設計A科目2020年09月國家開 放大學(中央廣播電視大學)
  • c語言程序設計基礎題庫,1253本科2016c語言程序設計試題,1253電大《C語言程序設計A》試題和答案200901
  • 肇事逃逸車輛無法聯系到車主怎么辦,1253尋找肇事司機