用tensorflow2神经网络拟合二维函数曲面4/(3*x)+1/y

作者：哥哥很霸道_277 | 来源：互联网 | 2023-10-12 18:27

我们采用神经网络拟合43x11x2我们采用神经网络拟合\space\space\frac4{3x_1}\frac1{x_2}我们采用神经网络拟合3x14x21实验记录&#x

$我们采用神经网络拟合43x1&＃43;1x2我们采用神经网络拟合\space\space\frac4{3x_1}&＃43;\frac1{x_2}$
实验记录&＃xff1a;
无论改变网络层数&＃xff0c;还是改变网络的激活函数&＃xff0c;当随机取点的范围由0.1-0.5变为0.001到0.5时&＃xff0c;误差总会迅速增大&＃xff0c;直到0-0.5时彻底跑飞。
原因很明显&＃xff0c;函数在x1,x2趋近0时值会变成无穷大&＃xff0c;那么怎么解决这一问题呢&＃xff1f;
答案非常简单&＃xff0c;替换损失函数——由mse换为msle.
整体的代码可以参考我的github项目。
在进一步的实验又发现了许多有趣的现象&＃xff0c;记录如下&＃xff1a;
1.使用shuffle之后&＃xff0c;训练效果变差&＃xff0c;卡在8.多左右&＃xff1b;
2.将第二个隐藏层的参数由2xsize变为3xsize之后&＃xff0c;效果也变差了&＃xff0c;也是误差下不去&＃xff1b;
以上两点都是在换成msle后出现的问题。
此外&＃xff0c;msle在拟合平面上效果也不错。&＃xff08;val集误差仅10-3量级&＃xff09;
至于优化算法&＃xff1a;至少在目前这两个网络结构上&＃xff0c;sgd和adam的表现差不多&＃xff1a;

(sgd)loss: 0.3602 - mean_squared_logarithmic_error: 0.3602 - val_loss: 0.5258 - val_mean_squared_logarithmic_error: 0.5258

(adam)loss: 0.3477 - mean_squared_logarithmic_error: 0.3477 - val_loss: 0.5307 - val_mean_squared_logarithmic_error: 0.5307

但是&＃xff0c;当sgd&＃43;将第二个隐藏层的参数由2xsize变为3xsize时(以下简称为“宽”()(9)&＃xff0c;效果竟然变的相当好&＃xff0c;这一下子网络变宽的性能竟然体现出来了&＃xff08;后来重新实验发现这种现象消失了&＃xff01;&＃xff01;&＃xff01;why?&＃xff09;&＃xff1a;

3125/3125 [&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;] - 1s 466us/step - loss: 0.2471 - mean_squared_logarithmic_error: 0.2471 - val_loss: 0.2247 - val_mean_squared_logarithmic_error: 0.2247

我尝试加深一层网络&＃xff0c;使用sgd和adam却都让网络变得很糟糕&＃xff0c;几乎没能拟合到什么东西&＃xff08;误差8.多下不去&＃xff0c;直接预测成平面&＃xff09;
尝试新的loss函数logcosh&＃xff1a;
我尝试了logcosh&＃43;sgd或adam在窄网络上&＃xff0c;logcosh&＃43;sgd在宽网络上&＃xff0c;结果都差不多&＃xff1a;误差一开始从80左右能降到40但之后就不行了&＃xff0c;观察图像&＃xff0c;发现他其实也差不多是平的&＃xff0c;但是好歹平移了一下:
在这里插入图片描述
总结&＃xff1a;下一步工作设计一个多层for循环自动调参&＃xff0c;使我看得更清楚。

为了解决当务之急&＃xff0c;我缩小了训练区域&＃xff0c;企图通过在小区域内密集训练实现更好的拟合效果&＃xff0c;但是效果仍不很明显&＃xff1a;

在这里插入图片描述
train0-0.3 test0-1 1331.

种群信息导出完毕。评价次数:25000 时间已过 1.6455268859863281 秒最优的目标函数值为:8.9836 最优的控制变量值为: 0.10010000000000001 0.4438835845159062

总会有一个差值。。。不知道怎么来的&＃xff0c;真实解是0.24-0.24

shuffle&＃61;True&＃43;1331&＃43;adam(sgd根本下不去&＃xff0c;这是强行下去了&＃xff0c;直接压成两个平面&＃xff0c;我服了这个网络的想法)&＃xff1a;
在这里插入图片描述拟合平面时不使用&＃xff08;或少使用&＃xff09;relu效果更好
&＃xff1b;
有时候就是运气不好&＃xff0c;优化算法没有奏效&＃xff0c;loss下不去&＃xff0c;拟合平面时用adam&＃43;msle尤为如此&＃xff1b;改为sgd&＃43;mse似乎更好一些

推荐阅读

算法
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
算法
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
git
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
git
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
git
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
git
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
git
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
git
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
git
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
git
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15
git
概论组合最优化问题、计算复杂性和启发式算法概念（现代优化计算方法）

1.组合最优化问题定义：是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述：最优化问题的数学模型的一般描述是，x为决策 ... [详细]

蜡笔小新 2023-10-17 18:23:43
git
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
git
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
git
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
ide
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25

哥哥很霸道_277

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章